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Prufungsantrag gem. § 44 PatG ist gestellt 

@ Verfahren zum Reduzieren der Datenrate von digitalen Bilddaten 

Zum Reduzieren der Datenrate von digitalen Bilddaten 
werden fur Teilbildbereiche in zeitlich aufeinanderfolgen- 
den Bildern Bewegungsvektoren dadurch ermittelt, dafS 
bezuglich zweier Bilder jeweils die Abweichung von der Po- 
sition des unverschobenen Teilbildbereichs zur tatsachli- 
chen Position des Teilbildbereichs im zeitlich fofgenden Bild 
ermittelt wird. 

Bei der Erfindung werden alle moglichen Bewegungsvekto- 
ren innerhalb eines Teilsuchgebietes durch nur eine Ersatz- 
verschiebungsposition charakterisiert. Ausgewahlt und an- 
schlie&end fur die Obertragung codiert wird jene Ersatzver- 
schiebungsposition, bei der die Ahnlichkeit der Teilbildbe- 
reiche zwischen zwei zeitlich aufeinanderfolgenden Bildern 
am gro&ten ist. 

■ Aus den ermittelten Bewegungsvektoren wird ein Schatz- 

(bild erstellt und durch Differenzbildung mitdem Originalbild 
ein Pradiktionsfehlerbild gebtldet. Die zu ubertragende Fen- 
lermenge aus dem Pradiktionsbild wird anhand eines Feh- 
lerkriteriums ausgewahlt. Die Signalisierung der ausgewahl- 
ten Bildteile wird uber einen aQuadtreea codien. Das Pradik- 
tionsfehlerbild wird klassifiziert und der Pradiktionsfehler 
entsprechend der Klassifizierung adaptiv grobquantisiert. 
Zur Grobquantisierung werden Strukturblocke gebildet. Fur 
Bildbereiche, in denen eine Bewegungskompensaiion ver- 
sagt, wird Originalbildinformatton in dekorrelierter Form 
ubertragen. 

Das Verfahren nach der Erfindung eignet sich insbesondere 
zur Bildubertragung fur einen 64 kbit/s-Kanal im ISDN-Netz. 
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Beschreibung 

Die Erfindung betrifft ein Verfahren gemaB dem Oberbegriff des Patentanspruchs 1. 

1. Stand der Technik 

Aus EP 236 519 Al ist es bekannt, Bewegungsvektoren fur Teilbildbereiche in zeitlich aufeinanderfolgenden 
Bildern einer Bildsequenz zu ermitteln, indem bezuglich zweier Bilder jeweiis die Abweichung von der Position 
des unverschobenen Teilbildbereichs zur tatsachlichen Position des Teilbildbereichs in eineni zeitlich folgenden 
Bild ermittelt wird. Die Bewegungsvektoren werden mittels eines Iterationsprozesses mit jedem Schntt genauer 
bestimmt. , . _ , - 

Aus der DE 37 04 777 CI geht hervor, eine DPCM-Schleife mit Quantisierung in Zusammenhang mit einer 
Pradiktionsfehlercodierung zur Bilddatenreduktion zu verwendea Fur stark bewegte Bildbereiche werden 
Bildpunktabhangige Informationen, die beispieisweise einer DCT-Codierung unterzogen werden, ubertragen. 

Zur Pradiktion wird im einfachsten Fall der vorhergehende "Frame" verwendet und das Bild in Blocxe 
konstanter GroBe segmentiert. Ein Bild block wird nur dann codiert und ubertragen, wenn der Pradiktionsfehler 
eine vorgegebene Schwelle uberschreitet (Conditional Replenishment) [\\ 

Durch Algorithmen zur Bewegungsschatzung kann das Verfahren verbessert werden. Dazu werden Verschie- 
bungsvektoren ermittelt, welche entweder einzelnen Bildpunkten, Bildblocken oder Objekten zugeordnet sind. 
Bei punktweiser Bewegungsschatzung wird der Bewegungsvektor meist rekursiv aus zwei Bildern einer Bildse- 
quenz bestimmt (pel recursive) [21 [3], [4 J Zur blockweisen Schatzung wird der zu ubertragende Block tnnerhalb 
eines begrenzten Gebietes des vorherigen Bildes verschoben und fur jede Position em FehlermaB berecnnet. Die 
Position mit minimalem Fehler ergibt den Verschiebungsvektor fur den Block (blockmatching). In der Literatur 
wird als Fehlerkriterium neben dem mittleren quadratischen Fehler (MSE) hauptsachlich die mittlere absolute 
Differenz(MAD) verwendet. Zur Beschleunigung der Suche nach dem minimalen Fehler werden meist schnelle 
Algorithmen eingesetzt [51 [61 [7], Eine Erweiterung des "blockmatching" ist dabei das sogenannte objectmat- 
ching" [8]. Dazu wird das Bild in bewegte Objekte segrnentiert und die Bewegungsinformation dem kompletten 
Objekt zugeordnet. A/ 

Zur Erzielung extrem niedriger Datenraten werden praktisch ausschlieBhch die beiden letztgenannten Ver- 
fahren verwendet, da die hier zu ubertragenden Zusatzinformationen fur die Verschiebungsvektoren gennger 
ist lm Falle des "objectmatchings" steht dem Vorteil.nur einen Vektor pro Objekt ubertragen zu mussen der 
Nachteil gegenuber, daB auch die Form der Objekte beschrieben werden muB. In [8] wird dafur erne relativ 
grobe Block-Approximation verwendet. t . 

Grundsatzlich wird bei alien Bewegungsschatzverfahren zwischen Pel-Genauigkeit (Integer-Genauigkeit) 
und Sub-Pel-Genauigkeit unterschieden. Pel-Genauigkeit bedeutet, daB sowohl die Bewegung im Bild beliebig 
fein sein kann, die Bewegungsvektoren nicht genauer als auf einen Bildpunktabstand genau berechnet werden. 
Dieser groberen Bewegungschatzung steht der Vorteil gegenuber, daB keine rechenaufwendige Interpolation 
zur Erreichung der Sub-Pel-Genauigkeit durchgefuhrt werden muB. 

Die Bewegungsvektoren werden anschlieBend auf das vorherige Bild angewendet, urn durch Verschiebung 
von Bildteilen des alten Bildes eine Schatzung des neuen Bildes zu erhalten (Bewegungskompensation) [9J,L10J. 
Die Grenzen des mit Bewegungskompensation zu erzielenden Codiergewinns bei hybnden Verfahren werden in 
[11] auf Basis der Rate-Distortion Theorie untersucht. Die dargestellten Ergebnisse gelten allerdings nur fur 
hohe S/N-Verhaltnisse und sind auf die Codierung fur eine Rate von 64 kbit/s wahrscheinlich nur bedingt 

anwendbar. , D .. . , 

Nach Subtraktion des bewegungskompensierten Schatzbildes vom aktuellen Bild verbleibt das Bild des 
Pradiktionsfehlers (Abb. 4.4.1a). Zur Obertragung dieses Fehlerbildes wird meist eine Blockaegmentierung in 
Blocke der GroBe 16*16 oder 8 * 8 durchgefuhrt und diese mit den ublichen Verfahren der Standbildcodierung, 
wie zum Beispiel Vektorquantisierung [12] oder diskrete Cosinus Transformation mit Quantisierung im Spek- 
tralbereich [131 codiert ubertragen. ' . 

Urn zu einer konstanten Datenrate zu gelangen wird meist ein Puffer verwendet, dessen Fullstand die 
Quantisierung oder andere Coderparametersteuert[14l Bei groBem Bewegungsanteil im Bild werden aufgrund 
des Ausgleichs durch grobere Quantisierung und der blockweisen Verarbeitung sehr schnell Block-Strukturen 
sichtbar (blocking-effect). Andere storende Effekte sind der sogenannte "dirty- window"- Effekt: Durch die grobe 
Quantisierung im Spektralbereich werden teilweise die Basisbilder der verwendeten Transformation sichtbar, 
die durch die starre Blocksegmentierung im Gegensatz zum Bildinhalt stillstehen. Dadurch hat der Betrachter 
den Eindruck, die Szene durch ein verschmutztes Fenster zu beobachten. Ein weiterer storender Effekt ist der 
sogenannte "mosqui to"- Effekt, der ebenfalls durch zu grobe Quantisierung hervorgerufen wird und an der 
Grenze zwischen bewegtem Objekt und stillstehendem Hintergrund einen flirrenden Bildeindruck erzeugt Die 
bewegten Bildteile erscheinen wie von Moskitos M umschwirrt w . Der iiberaus storende Bildeindruck durch Sicht- 
barwerden des Blockrasters bei zu hohem Bewegungsanteil (blocking-effect) wird zusatzhch dadurch yerstarkt, 
daB das verwendete Blockraster von Blocken der GroBe 8 • 8 oder 16 • 16 zu Ortsfrequenzen fuhrt, die gerade 
imBereichmaximalerSensivitatdesmenschlichenSehapparatesIiegen[15l 

Da das vorherrschende Bildmaterial meist keine Auflosung von Bewegungen mil 25 Hz erfordert, wird ott 
eine zeitliche Unterabtastung vorgenommen. Dazu wird nur jeder zweite oder jeder dntte Frame ubertragen. 
Die pro Bild zur Verfugung stehende Datenrate verdoppelt oder verdreifacht sich also. Durch eine Filterungder 
Eingangssequenz mit Hilfe eines meist rekursiven TiefpaBfilters kann die Effizienz der Pradiktion durch starker 
werdende zeitliche Korrelation gesteigert werden. Auf der Empfangerseite ist eine Ruckgewmnung der ausge- 
lassenen Frames erforderlich. Im einfachsten Fail wird ein Frame wiederholt, also mehrfach gezeigt (frame 
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repetition). Dies fuhrt jeUffi zu einem ruckhaften Ablauf der BewegungerWcin anderes Verfahren erzeugt die 
ausgelassenen Frames durch lineare Interpolation zwischen den ubertragenen Frames. Die Bewegungen er- 
scheinen hierbei zwar fliissiger, doch es entstehen storende Doppelkanten an bewegten Luminanzsprungen. 
Dies kann nur durch eine bewegungsadaptierte Interpolation vermieden werden. Dazu ist eine Segmentierung 
des Bildes in bewegte Objekte, freiwerdenden und bedeckten Hintergrund natig. AuBerdem sind Bewegungs- 5 
vektoren erforderlich, die mit der realen Bewegung der Objekte Ubereinstimmen. Die zur Erzielung eines 
minimalen Pradiktionsfehlers ermittelten Vektoren, insbesondere wenn schnelle Suchalgorithmen verwendet 
werden, sind hierzu ungeeignet 

2. Aufgabe uhd Losung 10 

Aufgabe der Erfindung ist es, ein Verfahren ausgehend vom Oberbegriff des Patentanspruchs 1 anzugeben, 
welches zu einer effektiven Bildcodierung, insbesondere des Pradiktionsfehlers, bei einer vorgegebenen niedri- 
gen Datenrate, z. B. 64 kbit/s, fuhrt, wobei Bewegungsablaufe unter Berucksichtigung des menschlichen visueilen 
Systems moglichst naturlich erscheinen sollen. 15 

Diese Aufgabe wird durch die kennzeichnenden Merkmale des Patentanspruchs 1 gelost Die Unteranspriiche. 
zeigen vorteilhafte Weiterbildungen dieses Verf ahrens auf. 

Das Verfahren nach der Erfindung gewahrleistet eine zuverlassige Bildrekpnstruktion auch fur schnelle 
Suchalgorithmen. Der Hardwareaufwand fur die Aufbereitung des Obertragungssignals ist geringer als bei den 
meisten bekannten Verfahren zur Bilddatenreduktion. 20 

Anhand der Abbildungen und Tabellen werden Ausfuhrungsbeispiele der Erfindung sowie bisherige Ldsun- 
gen der Bilddatenreduktion im Zusammenhang mit der Erfindung nun naher erlautert Es zeigen: 

Abb. 3.1.1 : Suchschritte bei 2D Logarithmic Search fur einen Verschiebungsvektor (2, 6), Anzahl der Schritte 5, 
nach [21]; 

Abb. 3.1.2: Suchschritte bei Three step Verfahren und Verschiebungsvektor (2,6) nach [21]; 25 
Abb. 3.1.3: Suchschritte bei Conjugate Direction Search fur einen Verschiebungsvektor (2, 6), Anzahl der 
Schritte: 9, nach [21]; 

Abb. 3.2.1 : Verlauf des Fehlerkriteriums iiber Verschiebung im gesamten Suchbereich; 

Abb. 3.2.2: Suchpositionen fur modifizierte voile Suche, d. h. voile Suche mit nachgeschaltetem Vektorquanti- 
sierer und synthetischem Codebuch, Bonus fur Nullvektor zur Segmentierung in bewegte/unbewegte Biidteile; 30 
Abb. 3.23: Verteilungsdichtefunktion der Vektorzustande; 
Abb. 3.2.4: Bewegungsvektorfeld ohne Nullvektorbonus; 
Abb. 3.2.5: Bewegungsvektorfeld mit Nullvektorbonus; 

Abb. 3.2.6: Leistungsvergleich der schnellen Suchverfahren, alle Verfahren arbeiten mit Segmentierung, Pel- 
Genauigkeit und Suchbereich ±6; 35 

Abb. 3.2.7: Vergleich der modifizierten vollen Suche mit voller Suche und 3-step Verfahren, Bedingungen wie 
in Abb. 32.6; 

Abb. 3.2.8: EinfluB der GroBe des Suchgebietes, voile Suche mit ±6 bzw. ±11 pels Suchbereich; 
Abb. 3.2.9: Prinzip der hierarchischen Suche am Beispiel eines Bewegungsvektors: 

1. Stufe: modifizierte voile Suche mit 1 bzw. 2 pel Auflosung; 40 

2. Stufe: voile Suche mit eingeschranktem Suchbereich und 0,5 pel Auflosung; 

Abb. 3.2.10: Vergleich der hierarchischen Suche (0,5 Pel Genauigkeit) mit voller Suche (1 Pel) und modifizier- 
tervoller Suche (1 Pel); 

Abb. 3.2.1 1 : Simulation der hierarchischen Bewegungskompensation: 
oben links: Orignalbild N 45 
oben rechts: Originalbild N + 3 

unten links: Differenzbild ohne Bewegungskompensation (2fach verstarkt) 
unten rechts: Differenzbild mit Bewegungskompensation (2fach verstarkt); 

Abb. 3.2.12; Differenzbilder (2fach verstarkt) bei verschiedenen Suchalgorithmen: 
oben links: 3-step- Verfahren 50 
oben rechts: voile Suche 

unten links: modifizierte voile Suche (mit Vektorquantisierung) Aufldsung 1 pel, Suchbereich ±11 pel 
unten rechts: hierarchische Suche, Auflosung: 0,5 pel Suchbereich: ± 1 1 pel; 
Tab. 3.3.1 : Korrelationskoeffizienten drtlich benachbarter Bewegungsvektoren; 

Tab. 3.3.2: Entropie der Bewegungsvektoren; 55 

Abb. 3.33: Prinzip der Quadtree-Codierung; 

Tab. 3.3.4: Quadtree-Codierung der Bewegungsvektoren; 

Abb. 4.1.1: Autokorrelationsfunktion in horizontaler (— ) und in vertikaler ( — ) Richtung, Originalsequenz: 
"MiBAmerika"; 

Abb. 4.1.2: 2-dimensionale Autokorrelationsfunktion fur die Originalsequenz "MiBAmerika"; 60 
Abb. 4.1.3: Autokorrelationsfunktion in horizontaler (— ) und in vertikaler (- - -) Richtung, Sequenz der Pradik- 
tionsfehlerbilder; 

Abb. 4.1.4: 2-dimensionale Autokorrelationsfunktion ftirdie Sequenz der Pradiktionfehlerbilder; 

Abb. 4.1 .5: Schaltung zur Gewinnung der HochpaBkomponente mittels TiefpaBfilterung des Bildes; 

Abb. 4.1.6: Modellierung der Statistik des Pradiktionsfehlersignals durch ein hochpaflgefiltertes Bildsignal 65 
Vergleich der Autokorrelationsfunktionen: 
— AKF Pradiktionsfehlerbilder 

AKF Hochpaflkomponenten der Originalbilder, Filterung: 7 • 7 FIRTiefpaB; 



>E 38 37 590 Al 



Abb. 4.1.7: Autokorrelationsfunfeon eines ideal hochpaBgefilterten Markov-PrHJ>/es erster Ordnung nach 
Gl. 4.1.21: A: - 2 ■ tz • A * r,/ 0 « 1 MHz; 

Abb. 4.2.1: Eigenwerte der Kovarianzmatrixen fiir Originalbilder (— ) und fur Pradiktionsfehlerbilder (- - -) 
normiertaufdengrdBtenEigenwertiT(l); 
5 Abb. 4.2.2: Varianten der DCT-Spektralkoef fizienten (BlockgroBe 8 * 8 Bildpunkte) fur Originalbilder (- ) und 
fiir Pradiktionsfehlerbilder (---), sortiert nach dem Betrag der Varianz; 

Abb. 43.2: Obertragene Bildsignalleistung in Abhangigkeit der Anzahl ubertragener DCT-Koeffizienten bei 
Anwendung der DCT auf Originalbilder (— ) und Pradiktionsfehlerbilder ( ); 

Abb. 4.2.4: Verteilungsdichtefunktion des Energiekompressionskoeffizienten fur Originalbilder (— ) und fur 
io Pradiktionsfehlerbilder (- -); 

Abb. 43.1 : Pradiktionsfehlerbild; 

Abb. 43.2: Verteilungsdichtefunktion des Pradiktionsfehlerbildes; 

Abb. 433: Modulationsiibertragungsf unktion des visuellen Systems (nach Campbell und Robson) [26] 1 ; 

Abb. 4.3.4: Blockschaltbild der Strukturcodierung; 
15 Abb. 43.5: Verteilungsdichtefunktion des Pradiktionsfehlerbildes nach Klassifikation in 4 Klassen; 

Abb. 4.3.6: Auftrittshaufigkeit der 81 moglichen Blocktypen; 

Abb. 437: Auftrittshaufigkeit der verbleibenden 31 Blocktypen; 

Abb. 4.4.1 : Blockschaltbild des Coders (a>herkdmmlich, (b) erfindungsgemaB; 

Abb. 4.4.2: Quadtree-Maskenbild zur Codierung der Orts- und Klasseninformation; 
20 Abb. 4.43:Codiertes Pradiktionsfehlerbild; 

Abb. 4.4.4: Rekonstruierte Bilder der Sequenzen "MISS AMERIKA" und "ALEXIS" nach Codierung mit 64 

Bevor auf das Verfahren nach der Erfindung im einzelnen eingegangen wird, seien zunachst einige Grundbe- 
griffe und bekannte Verfahren erlautert 

25 

3. Bewegungsschatzung und Kompensation 

Die Verarbeitung von Bildsequenzen ist fur sehr viele Anwendungsgebiete [16] von Bedeutung, von denen 
einige hier auf gezahit sind: 

*) Industrie: ProzeBuberwachung, "robot vision" 

*) Medizin: Bewegungs Studien aus Rontgenfilmszenen oder Zellbewegungen 
*) Meterologie: Verfolgung von Wolkenbewegungen 
*) Verkehrstechnik:OberwachungdesStraBenverkehrs 

*) Nachrichtentechnik: Bilddatenkompression fur Bildtelefon, Videokonferenzen oder HDTV-Ubertra- 
gung 

In alien Fallen ist die Bewegungsanalyse von groBer Bedeutung. Bewegungen in der Szene auBern sich in 
Anderungen des Helligkeitsverlaufes von Bild zu Bild. Diese Anderungen konnen zur Schatzung der Bewegung 
herangezogen werden. Fur den Anwendungsfall der Bewegtbildcodierung, der hier interessieren soil, kann die 
Effizienz von DPCM- Verfahren durch Bewegungsschatzung und Kompensation erheblich gesteigert werden. 
Dazu wird die Bewegung zwischen zwei oder mehr aufeinanderfolgenden Bildern geschatzt und zur Verbesse- 
rung der Pradiktion eingesetzt. Die errechnete Bewegungsinformation in Form eines Bewegungsvektorfeldes 
unterscheidet sich je nach eingesetztem Verfahren hinsichtlich des zugrundeliegenden Bewegungsmodells und 
45 derGenauigkeitder Vektoren: * 

Die meisten zur Beschreibung der Bewegung herangezogenen Modelle sind aus Gninden des Aufwandes 
recht einfach gehalten und gehen zum Beispiel von starrer translatorischer Bewegung der Objekte in der Szene 
aus. Andere Bewegungsformen, wie z. B. Rotation oder Verformung der Objekte, mussen durch Verschiebung 
starrer Bildteile approximiert werden. Dies ist nur bei kleinen Bewegungen hinreichend exakt. 
Bei der Genauigkeit der Vektoren unterscheidet man zwischen pel- und sub-pel-Genauigkeit: 
1m ersten Fall werden die Vektoren nur auf einen Bildpunkt genau (Integer) berechnet, obwohl die Bewegung 
in der Szene naturlich beliebig fein erfolgen kann. Zur Erzielung groBerer Genauigkeit (sub-pel) ist eine 
Interpolation der Bildpunkte erforderlich, was einen erhohten Aufwand bedeutet. 

Soil die Bewegungsinformation auch zur bewegungsrichtigen Interpolation ausgelassener Bilder im Empfan- 
ger eingesetzt werden, so ist die Zuveriassigkeit der Vektoren zur Beschreibung der wahren Bewegung unab- 
dingbar. Wahrend fur die Pradiktion Mehrdeutigkeiten der Vektoren, d. h. verschiedene Vektoren fuhren zum 
gleichen Schatzbild, nicht negativ in Erscheinung treten, ist dies bei bewegungskompensierter frame-Interpola- 
tion oder frame- Extrapolation nicht der Fall. In diesem Fall muB auch eine Oberschreitung des Vektor-Wertebe- 
reiches vermieden werden. 

Im folgenden werden zunachst verschiedene, aus der Literatur bekannte, Verfahren zur Bewegungsschatzung 
vorgestellt. Die Algorithmen besitzen entweder eine hohe Komplexitat die Hardware im pie men tie run gen imcht 
zuganglich ist, oder postulieren Modelle, die der Praxis oft nicht hinreichend entsprechen. Zur Losung dieser 
Probleme wird ein neues zweistufiges Verfahren vorgestellt und in Bezug auf Leistungsfahigkeit und Aufwand 
mit anderen Ansatzen verglichen. SchlieBlicb wird eine geeignete Codierung der Bewegungsvektorinformation 
65 diskutiert. 
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3.1 Algorithmenzur Bewegungsschatz 

3.1.1 Verfahren im Spektralbereich 

Nach dem Verschiebungssatz der Fourier-Transformation kann eine Verschiebung im Originalbereich aus der 
Phasendifferenz zwischen den Fourier-Transformierten des Originals und des verschobenen Biides berechnet 
werden: 

F(u,v)\f(x,y) (3.1.1) 
G{u,v)\g(x,y) = f(x-Ax,y-Ay) (3.1.2) 

Aq> )u,v) - zrg(G(u,v) - arg(F(u,v) = -2ff • (u • Ax + v • Ay) (3.13) 

Bestirnmt man A<p fur zwei Frequenzpaare (u,v) kann daraus {Ax, Ay) berechnet werden. Zu beachten ist 15 
allerdings, daB die Berechnung der Phase n verschiebung wegen der Mehrdeutigkeit der Arkustangensfunktion 
nicht eindeutig ist Dieses Problem kann jedoch unter Beriicksichtigung des Bereiches der moglichen Verschie- 
bung gelost werden. Schwerwiegender ist die Forderung, daB das Objekt sich vor konstantem Hintergrund 
bewegen muB. Andernfalls erhalt man g(x,y) nicht durch Verschiebung von f(x,y) wie in Gleichung 3.13 (freiwer- 
dender bzw. verdeckter Hintergrund). Eine Losung fur den Fall nicht-uniformen Hintergrundes ist die Segmen- 20 
tierung der bewegten Objekte zur Trennung vom Hintergrund oder der Einsatz der Phasenkorrelationstechnik. 
Letzteres Verfahren ist schon vor einiger Zeit [1 7] veroffentlicht worden und ist wie folgt def iniert [1 8]: 

rLtKx.y) \\F(g(x.y))* F(fUy))\ J 

Dabei bezeichnen F, F^ 1 die Fourier-, bzw. inverse Fourier-Transformation und das Symbol * konjugiert 
komplex. Die Korrelation wird uber einen Bildblock durchgefuhrt, dessen Dimensionen vorzugsweise Zweier- 
potenzen sein sollten, urn den Einsatz der FFT zu ermoglichen: Die Stelle des Maximums der Phasenkorrela- 30 
tionsfunktion PCFfcy^korrespondiert zu der Verschiebung des Gebietes. Wegen des erforderlichen Rechenauf- 
wandes sollen die Verfahren im Frequenzbereich zur Anwendung in einem Bildtelefon hier nicht weiter in 
Betracht gezogen werden. 

3.1.2 Differentielle Verfahren 35 

Unter der Voraussetzung, daB sich nur die Positionen der Bildpunkte, nicht aber deren Helligkeiten andern, 
lassen sich zeitliche Differenzen in ortliche Differenzen uberfuhren. Die Helligkeitsanderung laBt sich bei reiner 
Translation durch die Gleichung: 

40 

f(x,y,t) - f(x-dx,y-dy, t-\) (3.1.5) 

beschreiben. Die Differenz zeitlich aufeinanderfolgender Frames betragt: 

Af(x,y)= ffayt)- f(x,y,t-\) (3.1.6) 45 

Unter den oben getroffenen Bedingungen kann die zeitliche Veranderung des Liminanzsignals in eine ortliche 
Veranderung uberfuhrt werden: 
Af(x,y) = f(x,y,t)- f(x + Ax,y+Ayt) (3.1.7) 

Entwickelt man den zweiten Term in eine Taylorreihe, die unter der Voraussetzung kleiner Bewegungen nach 
dem ersten GHed abgebrochen werden kann, erhalt man: 

f(x+ Ax,y+Ay) - F(x,y) + . Ax + MmL . Ax + . . . {ZA &) 

Af(x,y)=-^Ax-^>Ay (3.1.9) 
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Fur jeden Bildpunkt fay) konnen nun die Ableitungen und der Wert Affay) berechnet werden. Durch 
Mittelwertbildung uber das bewegte Gebiet erhalt man eine Schatzung fur (Ax, Ay) [19J Da der bechriebene 
Algorithmus einen linearen Verlauf der Helligkeil am Punkt der. Ableitung voraussetzt, konnen nur kleine 
Bewegungen hinreichend genau bestirnmt werden. Durch rekursive Verfahren [2J 20 konnen einerseits grbBere 
Verschiebung berechnet werden, andererseits ergibt sich eine verbesserte Genauigkeit der Vektoren. Dazu 65 
wird, ausgehend von einer Schatzung fur den Bewegungsvektor BW, ein verbesserter Vektor BW* + i berech- 



net: 
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BW 1 ** - SW 1 -h U 1 (3.1.10) 

Der "Update"-Term & zur Verbesserung des Bewegungsvektors BW 1 ergibt sich aus der Minimierung der 
sogenannten "displaced frame difference" (DFD). Diese errechnet sich unter Verwendung des bisherigen Bewe- 
gungsvektors BW 1 wie folgt: 

DFD(x,y,BW) - f(x,y,t) - ffx-AxKy-Ay 1 , (-1) (3.1.11) 

Die verschiedenen Verfahren unterscheiden sich durch die Berechnung des Minimums von DFD. Der Genau- 
igkeit der Verfahren steht ein erheblicher Rechenaufwand entgegen. Zusatzlich entstehen infolge der rekursiven 
Struktur nicht-konstante Coderdurchlaufzeiten, die die Eignung der Verfahren fur eine Hardwarerealisierung in 
einem Bildtelefon in Frage stellen. 

3.13 Suchverfahren ("matching"- Verfahren) 

Anstelle einer rekursiven Bestimmung des Bewegungsvektors kann eine Kreuzkorrelation der zu betrachten- 
den Gebiete aufeinanderfolgender Frames vorgenommen werden. Der Verschiebungsvektor ergibt sich aus der 
Position der maximalen Korrelation. ]e nach Form der miteinander korrelierten Gebiete unterscheidet man das 
sogenannte "object matching" oder "block matching" Verfahren. 

Objektorientierte Verfahren zur Bewegungsschatzung (object matching) [8], [21] zerteilen das Bild in Bereiche 
die zu den Objekten in der Szene korrespondieren und fiir die dann jeweils ein Bewegungsvektor ermittelt wird. 
Es ist also eine Segmentierung des Bildes in zusammenhangend bewegte Bildteile erforderlich. Dies ist einerseits 
mit hohem Rechenaufwand verbunden, andererseits muB dem Empfanger neben der eigentlichen Bewegungsin- 
formation die Form der Objekte mitgeteilt werden. Zur Beschreibung der Bewegung der Einzelobjekte sollten 
neben reinen translatorischen Verschiebungen auch Rotationen und ggf. Grofienanderungen (Zoom) beruck- 
sichtigt werden. In [8] werden die Objekte durch Bldcke der GroBe 8*8 approximiert, indem man zusammen- 
hangende Blocke mit gleichem Bewegungsvektor einem Objekt zuordnet. 

Beim block matching wird das Bild in rechteckige Blocke der GroBe M— A/ Bildpunkte segmentiert Dabei 
werden meist Bldcke der GroBe 8 • 8 oder 16 • 16 verwendet. Unter der Annahme, daB alle Bildpunkte innerhalb 
der Blocke der gleichen Bewegung unterliegen, werden die Blocke innerhalb eines Suchbereiches verschoben 
und mit dem vorhergehenden Frame korreliert. Es wird also nur ein Bewegungsvektor pro Block bestimmt. 
Rotationen und GroBenanderungen von Bildobjekten konnen bei geniigend kleiner BlockgroBe und kleiner 
Bewegung durch unterschiedliche Translationen der einzelnen Bldcke ausreichend genau beschrieben werden. 
Aus der maximalen Verschiebung D max in horizontal und vertikale Richtung und einer BlockgroBe von N ■ M 
Punkten errechnet sich die Flache des Suchgebietes: 

AR = (M+ 2 • Dmax) • (N+2D wax ) (3.1.12) 

Zum Auffinden des Minimums der FCreuzkorrelationsfunktion wird im allgemeinen ein Fehlerkriterium E 
definiert und nach der Position des Minimums von E gesucht. Haufig verwendete Fehierkriterien sind der 
mittlere quadratische Fehler MQFoder die mittlere absolute Differenz MAD: 



Ki N 

MQF(Ax, Ay) = ] — • X ^ (J{m, n, /) - f(m + Ax. n + Ay. t- l)) 2 (3.1.13) 

M ' N ' m i n I 
M N 

MAD (Ax, Ay) = — } — • Y Y \f(m. n> /) ~/(m + Ax. n + Ay. r-\)\ (3.1.14) 
M-N m , „ , 

Die Bestimmung des MOF FehlermaBes erfordert fur jede verglichene Vektorposition je N - MSubtraktio- 
nen, Multiplikationen und Additionen. Bei einem Suchfenster von D max = 6 Bildpunkten in jeder Richtung sind 
zur Bestimmung des Bewegungsvektors fiir einen Block bei voller Suche 

Qfo = (2 - D max + l) 2 - 13 • 13 = 169 (full search) (3.1.15) 

dieser Berechnungen notwendig. Zur Verringerung dieses Rechenaufwandes werden in der Literatur verschie- 
dene schnelle Algorithmen angegeben [21]: 

Das M 2D-logarithmic" Suchverfahren [5] ist schematisch in Abb. 3.1.1 dargestellt. In jeden Suchschritt wird 
jeweils eine vierer Nachbarschaft auf minimalen Fehler untersucht. Die Suche wird vom so gefundenen Punkt 
minimalen Fehlers solange fortgesetzt; bis keine Verbesserung des Fehlers mehr erzielt werden kann oder der 
Rand des Suchgebietes erreicht wird. Dann wird die Suche mit verringerter Verschiebung fortgesetzt Die 
Anzahl der Suchschritte ist vom Bildmaterial abhangig und variiert auch mit der Wahl der Abstandswerte. Fiir 
ein Suchgebiet mit D m ax — 6 ergeben sich maximal Qi s = 21 FehlermaBberechnungen. 

Das "three step" genannte Verfahren [7] liefert, im Gegensatz zum oben erwahnten 2D-logarithmic Verfahren, 
nach genau drei Suchschritten einen Vektor. Dazu wird eine achter Nachbarschaft in jedem Schritt untersucht 
und die Schrittweite in jedem dieser Schritte reduziert, Abb. 3.1.2. Es wird im allgemeinen in Schritten mit 
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Distanzwerten von 3, 2^Brl Pixel gesucht, wodurch eine SuchbereichsgWBe von 6 Pixeln in jede Richtung 
erreicht wird. Bei diesem Verfahren werden zur Bestimmung eines Bewegungsvektors Q ts = 3 • 8 + 1 » 25 
Berechnungen des FehiermaBes benotigt. Eine VergroBerung des Suchbereiches bei gleicher Auflosung kann 
nur durch die Einfuhrung weiterer Suchschritte erreicht werden. 

Ein weiteres Verfahren "conjugate direction" [6], welches Abb. 3.13 zeigt, sucht (in der vereinfachten Form 
nach Musmann [21]) zuerst das Fehlerminimum in horizontaler, und danach, ausgehend von diesem Punkt, in 
vertikaler Richtung. Hierbei werden Verschiebungen in diagonalen Richtungen nicht genugend berucksichtigt. 
Die Zahl der FehlermaBberechnungen ist vom gefundenen Bewegungsvektor abhangig. Zur Bestimmung des 
Bewegungsvektors werden maximal (?«/ * 2 • (D max + 1) + 1 « 15 dieser Berechnungen benotigt. 

32 Modifizierte voile Suche 
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3.2.1 Fehlermodell 



Alle oben aufgezeigten schnellen Suchverfahren gehen von einem monotonen Fehlermodell aus: is 
Unter der Annahme, daB das Fehlerkriterium von der Position der wahren Verschiebung in alle Richtungen 
monoton ansteigt, konvergieren schnelle Suchverfahren auf das absolute Minimum. Anschaulich muBte das 
Fehlerkriterium dargestellt in der Ebene der moglichen Verschiebungen einen Trichter ergeben, dessen Mini- 
mum bei der Position des wahren Bewegungsvektors liegt. In Abb. 3.Z1 ist der Verlauf des FehlermaQes MQF 
iiber der Verschiebung fiir einen realen Bildblock dargestellt. Es ist deutlich erkennbar, daB bei derartigem 20 
Fehlerverhalten keine Konvergenz der schnellen Suchverfahren auf das absolute Minimum erwartet werden 
kann. Durch die Feinstruktur der Objekte und Rauschen im Bildsignal entstehen lokale Minima des Fehlersigna- 
les. auf die die schnellen Suchalgorithmen konvergieren. Durch eine TiefpaBfilterung der Ausgangsbilder kann 
dieser Effekt zwar verringert werden, die Genauigkeit der Bewegungsschatzung wird dadurch jedoch beein- 
trachtigL 25 

Das absolute Fehlerminimum wird unabhangig vom Verlauf des Fehlerkriteriums uber der Verschiebung 
durch eine voile Suche gefunden. Ein Suchbereich der GroBe Dmax = 1 1, welcher bet zeitlicher Unterabtastung 
urn den Faktor 3 mindestens erforderlich ist, benotigt jedoch Qf s - 23 • 23 = 529 Suchpositionen. An jeder 
Position ist die Differenz der Bildpunkte des Blockes und eine Akkumulation der Differenzen im Falle des 
A//tZXKriteriums zu berechnen. Dies ergibt fiir eine BlockgroBe von 16 • 16 Punkten 256 Subtraktionen und 30 
Additionen. Insgesamt sind pro Bild ca. 107 Millionen Operationen notig urn das Vektorfeld zu bestimmen. 

3.2.2 VektorquantisierungderBewegungsvektoren 

Durch Kombination der volien Suche mit einer anschlieBenden Vektorquantisierung der Bewegungsvektoren 35 
kann der oben genannte Rechenaufwand erheblich reduziert werden: Entsprechend der Eigenschaft des 
menschlichen visuellen Systems, daB schnelle Bewegungen nur ungenau aufgelost werden konnen, wird nur in 
einer kleinen Umgebung der Nullposition jede Position abgesucht, in groBerem Abstand vom Nullpunkt wird 
ein groberes Raster verwendet. Dieser Zusammenhang ist in Abb. 3.2.2 fur einen Suchbereich von ±6 Punkten 
mit einem Bereich von ±2 Punkten mit voller Auflosung dargestellt. Im Coder wurde ein Bereich von ±3 40 
Punkten mit voller Auflosung bei einem Gesamtsuchbereich von ± 1 1 Punkten verwendet Die Aufldsung wird 
im auBeren Bereich halbiert, so daB nur noch ein Viertel aller Positionen abzusuchen ist. Der Rechenaufwand 
reduziert sich entsprechend auf Q m fs ™ 137 Suchpositionen. Da fiir die jetzt entfallenden Vektorpositionen kein 
Codewort im Codebuch reserviert werden muB, reduziert sich auch die bendtigte Datenrate fur die Obertragung 
der Bewegungsvektoren. Das Verfahren wird auch durch die Verteilungsdichtefunktion der Vektorzust&nde, die 45 
in Abb. 323 dargestellt ist, gerechtfertigt. GroBere Vektoren werden nur mit wesentlich geringerer Wahrschein- 
lichkeit zugewiesen als kleine Vektoren. Das hier geschilderte Verfahren der synthetischen Codebuchgenerie- 
rung kann durch eine iterative Optimierung des Codebuches noch weiter verbessert werden, 

3.2.3 Segmentierung 50 

Die Anwendung eines Bewegungsschatzverfahrens auf unbewegte Bildbereiche mit wenig Struktur fuhrt 
schon bei schwach verrauschten Bildsignaien zur Bestimmung von vom Nullvektor verschiedenen Bewegungs- 
vektoren. Da die unbewegten Bildbereiche, vor allem im Biidhintergrund, bei den fUr Bildtelefonanwendung als 
typisch anzusehenden "Kopf-Schulterbildern" einen Anteil von 50% bis 80% oder mehr haben konnen f fuhrt 55 
dieses Verhaiten zu einem starken Anstieg der fur die Obertragung der Bewegungsvektoren bendtigten Daten- 
rate. Bei der Bildrekonstruktion bewirken diese Bewegungsvektoren im Original nicht vorhandene Aktivitat und 
Fluktuationen im Biidhintergrund, die uberaus storend in Erscheindung treten. In Abb. 3.2.4 ist ein solches 
Vektorfeld dargestellt. Die Einfuhrung einer Schwelle fur den Start der Bewegungsvektorsuche fuhrt zu einer 
weitgehenden Unterdriickung der durch Rauschen verursachten, vom Nullvektor verschiedenen Bewegungs- 60 
vektoren in unbewegten Bildbereichen. Die Suche wird dabei nur dann gestartet, wenn das FehlermaB an der 
Position des Nullvektors diese Schwelle ubersteigt. Dies ist bei durch Rauschen hervorgerufenen Bildanderun- 
gen und richtiger Dimensionierung der Schwelle nicht der Fall. Die Schwelle sollte adaptiv an die Qualitat des 
Bildmaterials angepaBt werden. 

Da fur die. betroffenen Bildbereiche die Suche nach dem Bewegungsvektor entfallt, wird bei typischem 65 
Bildmaterial der Rechenaufwand fur die Bewegungskompensation urn den Faktor 2 bis 3 reduziert Auch bei 
Bildblocken, die diese Schwelle uberschreiten, soil nur dann ein von Null verschiedener Bewegungsvektor 
bestimmt werden, wenn der Nutzen dieses Vektors groBer ist als die "Kosten" fur die Obertragung des Bewe- 
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gungsvektors. Der Nullvektor wird deshalb nur dann ersetzt, wenn das FehlermaB, nach AusfUhrung der 
Bewegungskompensation, das des Nullvektors urn diesen sogenannten Bonus unterschreitet. Abb. 3.2.5 zeigt das 
entsprechende Vektorfeld nach Einfuhrung dieser beiden Modifikationen. Es ist deutlich erkennbar, daB die 
rauschbedingten Vektoren (verg)eiche Abb. 3.2.4) im Bildhintergrund verschwinden. Die Gute der Pradiktion in 
tatsachlich bewegten Bereichen wird durch diese MaBnahmen nicht beeintrachtigt. 

Die Bevorzugung des Nullvektors durch die Einfuhrung des Bonus hat den weiteren Vorteil, daB die Form der 
Verteilungsdichtefunktion der Vektorzustande gunstig beeinfluBt wird Die extreme Ungleichverteilung der 
Vektorzustande mit bis zu 50% Nullvektoranteil kann durch Anwendung einer Entropiecodierung (Huffmanco- 
de) vorteilhaft ausgenutzt werden. 

3.2.4 Vergleich verschiedener Bewegungsschatzalgorithmen 

Zur Beurteilung von Bewegungsschatzalgorithmen mussen die erzeugten Vektorfelder in zweierlei Hinsicht 
uberpruft werden: 

— Genauigkeit der Vektoren: Die Leistung des Pradiktionsfehlerbildes muB minimiert werden. 

— Zuverlassigkeit der Vektoren: Die Bewegungsvektoren mussen die wahre Bewegung der Objekte 
widerspiegeln, urn zur Interpolation bzw. Extrapolation ausgelassener Frames einsetzbar zu sein. 

Wahrend der zweite Punkt Gegenstand von Kapitel 6 ist, sollen hier die verschiedenen Algorithmen auf ihre 
20 Fahigkeit, das Differenzsignal nach Bewegungskompensation - also den Pradiktionsfehler - zu minimieren, 
untersucht werden. Als Kriterium wird die Leistung des bewegungskompensierten Differenzbildes in Relation 
zur Leistung des nicht bewegungskompensierten Differenzbildes gesetzt In die Berechnung werden nur Biocke 
einbezogen, die zum bewegten Vordergrund gehdren, die oben beschriebene Segmentierung mit Hilfe der 
Schwellenoperationen wird also fur alle Verfahren gleichermaBen verwendet 

In Abb. 3.2.6 ist dieses Verhaltnis fur verschiedene schnelle Suchverfahren und fUr die volie Suche uber den 
untersuchten Bildern der Testsequenz "MISS AMERICA" aufgetragen. Ein y- Achsenwert von 0,10, zum Beispiel, 
bedeutet eine Reduktion der Leistung des Pradiktionfehlerbildes urn 90% durch Einsatz der Bewegungskom- 
pensation. Der Verlauf des JCriteriums fiir die voile Suche stellt das erreichbare Optimum dar und spiegelt die 
Bewegungskompensierbarkeit der Bilder wider: Ein groBer Wert, selbst im Fall der vollen Suche, deutet auf 
Bildbereiche, die nicht aus dem vorhergehenden Bild stammen und daher nicht wegkompensiert werden konnen, 
z. B. SchlieBen der Augen. Alle gezeigten Verfahren haben einen Suchbereich von ±6 Pixeln, die BlockgroBe 
betragt 8 * 8 Bildpunkte. Die ermittelten Vektoren haben jeweils Pel-Genauigkeit Die Leistungsfahigkeit der 
Verfahren korrespondiert zum jeweiligen Rechenaufwand: Wahrend das 3-Step Verfahren und das "logarithmic 
search" Verfahren relativ ahnliche Ergebnisse liefern - mit leichten Vorteilen fiir das 3-Step-Verfahren — , 
verhalt sich das "conjugate gradient"- Verfahren deutlich schlechter. Keines der Verfahren erreicht bemerkens- 
werterweise in auch nur einem Bild die Leistungsfahigkeit der vollen Suche, was die obige Aussage unterstreicht, 
daB das Fehlermodell der schnellen Verfahren der Praxis nicht hinreichend entspricht. 

Abb. 3.2.7 vergleicht das voile Suchverfahren mit der oben beschriebenen modifizierten vollen Suche (voile 
Suche mit Vektorquantisierung) und dem 3-step Verfahren, als bestem Vertreter der schnellen Suchverfahren. 
Die Leistungsfahigkeit der modifizierten Suche approximiert die Leistung der vollen Suche in vielen Fallen 
besser als das 3-step Verfahren. Es existieren jedoch Situationen, in denen das kiinstlich generierte Codebuch der 
vollen Suche mit Vektorquantisierung die eigentlich notigen Bewegungsvektoren fur minimalen Fehler nicht 
enthalL Dies ist zum Beispiel bei den Bildnummern 75 oder 96 der Fall. Dann erzielt sogar das 3-step- Verfahren, 
welches je mit Pel-Genauigkeit arbeitet, bessere Ergebnisse. Eine Erweiterung der modifizierten vollen Suche, 
45 welche auch diesen Nachteil vermeidet, wird in Kap. 3.2.5 vorgestellt. 

SchlieBlich wurde der EinfluB der GroBe des Suchbereiches untersucht Dazu wurde ein Suchbereich der 
GroBe ±6 Punkte mit einem Suchbereich der GroBe ±11 Punkte verglichen. In beiden Fallen wurde eine voile 
Suche durchgefuhrt. Wie Abb. 3.2.8 zeigt ist ein Suchbereich von ±6 Punkten nicht ausreichend. Eine weitere 
VergroBerung uber ±11 hinaus ergab fiir die Testsequenz "MISS AMERICA" keine weitere wesenthche 
50 Verbesserung. 

3.2.5 Hierarchische modifizierte voile Suche 
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Mit dem oben beschriebenen Algorithmus der modifizierten Suche erhalt man Vektoren, die nur in einem 
kleinen Bereich urn den Nullpunkt Pel-Genauigkeit aufweisen. Im Bereich auBerhalb betragt die Auflosung 
sogar nur 2 Pel, so daB das im letzten Schritt stets mit 1 Pel Genauigkeit arbeitende 3-step- Verfahren in 
bestimmten Situationen bessere Ergebnisse liefert. Dies ist namlich immer dann der Fall, wenn vom Bildmatenal 
Bewegungsvektoren gefordert werden, die sich nicht im Codebuch befinden. Untersuchungen [18] haben dar- 
uberhinaus gezeigt, daB eine Genauigkeit von 0,5 Pel anzustreben ist. Die mit noch feinerer Auflosung erreichba- 
eo ren Verbesserungen sind gering und werden durch den notigen Aufwand nicht gerechtfertigt 

Die durch die modifizierte voile Suche erzielten Bewegungsvektoren werden nun als erste Schatzung betrach- 
tet und durch Nachschalten einer zweiten Bewegungsschatzung verbessert. Diee zweite Stufe arbeitet mit einem 
sehr kleinen Suchbereich aber mit sub-Pel-Genauigkeit. Die Berechnungen der Bildpunkte zwischen den Raster- 
punkten wird mit Hilfe einer bilinearen Interpolation durchgefiihrt. Die Kombination der beiden Suchalgonth- 
men kann als hierarchisches Verfahren bezeichnet werden. Abb. 3.2.9 zeigt das Prinzip des Verfahrens. 

Wie Abb- 3.2S zeigt, werden zunachst die Verschiebungen von Teilbildbereichen in einem in Teilsuchgebiete 
gegliederten Suchgebiet ermittelt. Jedes Teilsuchgebiet wird durch eine Ersatzverschiebungsposition charakte- 
risiert. In Abb. 3.2.9 ist die Ersatzverschiebungsposition durch den "Bewegungsvektor nach 1. Stufe* dargestellt, 
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d. h. alie moglichen Be wePPTgs vektoren innerhalb des Teilsuchgebiets weraen durch die Ersatzverschiebungs- 
position beschrieben (Vektorquantisierung). Er fuhrt zum Mittelpunkt des Teilsuchgebiets des 1. Suchschritts. 
Fur den 2.Suchschritt wirddas im 1. Schritt gefundene Teilsuchgebiet welches die groBte Ahnlichkeit bezuglich 
desTeilbildbereichs mit dem zeitlich davor liegenden Bild aufweist, fur eine feinere Suche mit erhohter drtlicher 
Aufldsung (0,5 pel) ausgewahlt. Die Suchgebiete im Ausfuhrungsbeispiel nach Abb. 3.23 haben eine rechteckige 5 
Umrandung. Diese Umrandung kann natiirlich in beliebiger Weise abgewandelt werden (Trapeze, Dreiecke, . . 
Insbesondere kann eine Anpassung an das vorliegende Bildmaterial und an die menschliche Augenempfindlich- 
keit erfolgen. 

Die mit dem hierarchischen Verfahren erzielten Ergebnisse sind in der Abb. 32.10 dargestellL Es ist zu 
erkennen, daB durch Anwendung der hierarchischen Suche die Fehlerleistung gegeniiber der vollen Suche mit 1 10 
Pel Genauigkeit deutlich verringert werden konnte und die Leistungsfahigkeit einer vollen Suche mit 0,5 Pel 
Genauigkeit gut approximiert wird. Durch Anwendung der modifizieren vollen Suche als ersten Stufe ist der 
dazu notige Rechenaufwand wesentlich geringer als bei anderen Verfahren mit 0,5 Pel Auflosung, da die Suche 
der zweiten Stufe auf einen sehr kleinen Suchbereich beschrankt ist. Das hierarchische Verfahren benotigt 186 
Suchpositionen bei einem Suchbereich der GroBe ± 11 Pel. Fur die voile Suche mit 0,5 Pel Genauigkeit und 15 
gleichem Suchbereich sind 2025 Suchpositionen zu uberprufen. Durch Verwendung der hierarchischen vollen 
Suche kann also eine Einsparung an Rechenzeit um den Faktor 1 1 bei annahernd gleicher Leistungsfahigkeit 
erzielt werden. Die modifizierte voile Suche als erste Stufe bietet daruberhinaus den Vorteil, daB eine Annahme 
uber das streng monotone Verhalten des Fehlerkriteriums bei Verschiebung nicht notwendig ist Abb. 32.1 1 
zeigt an Hand eines Bildbeispiels die Leistungsfahigkeit der hierarchischen Suche: Die Pradiktionfehlerleistung 20 
bei Codierung des Bildes 4* 84 der Sequenz "MISS AMERICA" konnte deutlich reduziert werden. In Abb. 3.2.12 
ist das Pradiktionsfehlerbild bei Codierung des gleichen Bildes aber Verwendung verschiedener Suchalgorith- 
men dargestelk. Zur Verdeutlichung der Unterschiede wurden die Pradiktionsfehlerbilder um den Faktor 2 
verstarkt Der subjektive Bildeindruck korrespondiert zum Fehlerkriterium in Abb. 3.2.10. 



3.3 Codierung der Bewegungsvektoren 



33.1 EhWzwei-dimensionale Codierung der Bewegungsvektoren 

Zunachst soil untersucht werden ob es gunstiger.ist, die Vektorkomponenten getrennt oder gemeinsam zu 
codieren. Fur die beiden ausgewahlten Verfahren wurde sowohl eine Entropiecodierung der Vektorkomponen- 
ten als auch eine zweidimensionale Entropiecodierung durchgefuhrt Es zeigte sich daB die Summe der Entro- 
pien der Einzelkomponenten in jedem Fall groBer ist als die Entropie des zweidimensionalen Vektors. 

33.2 Differenzcodierung der Bewegungsvektoren 
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Unter dem Gesichtspunkt der Effizienz werden verschiedene Verfahren der Bewegungsvektorcodierung 
verglichen [22} Untersucht wurden eine voile Suche bzw. modifizierte voile Suche mit Pel-Genauigkeit der 
Vektoren und einem Suchbereich von ± 6 Bildpunkten. Bei der modifizierten vollen Suche betragt der Bereich 30 
maximaler Aufldsung ±2 Bildpunkte. Den Angaben der Gesamtbitzahl pro Bild fur die Bewegungsvektoren 
liegt das CIF-Format und eine BlockgroBe von 16 • 16zugrunde. 
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Da die bewegten Objekte im Bild groBer als die zur Bewegungsschatzung verwendeten Bildblocke sind. kann 
zwischen den Bewegungsvektoren benachbarter Blocke eine gewisse Correlation erwartet werden. Die furdrei 
verschiedene Sequenzen gemessenen Korrelationen zeigt Tabelle33.1. Man erkennt, daB die speziell fur Se- 45 
quenzen mit wenig Bewegung ("ALEXIS") sehr gering sind. Es wurden drei verschiedene Codierverfahren 
verglichen und in Tabelle 33.2 gegenubergestellt: 

— Zweidimensionale Entropiecodierung der Vektoren. 

— Interframe Pradiktion aus zeitlich vorhergegendern Vektor an gleicher Position 50 

— Interframe Pradiktion aus oberen und linken Nachbarvektoren 

Wahrend die zeitliche Pradiktion leichte Vorteile zeigt t weist die raumliche Pradiktion auBer bei *TREVOR" 
nur Nachteile auf. Da durch die Verwendung von Vektordifferenzen die Anzahl der moglichen Vektorzustande 
stark erhdht wird, werden die Verbesserungen meist durch einen schlechteren Code kompensiert. Fur den Fall 55 
sehr starker Bewegung und speziell bei Kamerabewegungen (Pan) kann das Verfahren der ortlichen Pradiktion 
der Bewegungsvektoren jedoch erhebliche Vorteile bringen. Diese Falle sind aber als nicht-typisch fur die hier 
betrachtete Anwendung anzusehen, daher soiien diese Codierverfahren nicht weiter verfolgt werden. 

3.33 Quadtree-Codierung des Bewegungsvektorfeldes 60 

Das mit dem in Abschnitt 3.2 vorgestellten Verfahren erzeugte Vektorfeld zeigt daB groBen zusammenhan- 
genden Bildbereichen im Bildhintergrund Nullvektoren zugeordnet werden. Ebenso sind Bereiche mit von Null 
verchiedenen Vektoren meist zusammenhangend. Diese Tatsache soil durch Verwendung eines quarternaren 
Baumes ausgenutzt werden. Abb. 333 zeigt das Prinzip. Enthalt das Bild von Null verschiedene Bewegungsvek- 65 
toren wird eine Unterteilung des Bildes in vier Unterbilder vorgenommen. Diese Untergliederung wird sukzessi- 
ve fortgesetzt bis ein Unterbild genau durch einen Bewegungsvektor reprasentiert wird Auf diese Art und 
Weise erreicht man die Zusammenfassung moglichst groBer Bereiche mit ausschlieBlich Nullvektoren undderen 
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gemeinsamerCodierung durch ein Bit 

In der Tabelle 33.4 ist dieses Quadtree-Verfahren der Bewegungsvektorcodierung an Hand der Sequenz 
"MISS AMERICA" dem Verfahren derzweidimensionalen Entropiecodierung der Vektoren gegenubergestellt 

Durch das Quadtree-Codierverfahren kann eine effizientere Codierung der Bewegungsvektoren erreicht 
werden. Obwohl fur den Baum zusatzliche Information ubertragen werden muB, entfallt die Obertragung einer 
groBen Zahl von Nullvektoren (20% -65%). Das Verfahren hat aber zusatzlich den Vorteil, daB bei abklingen- 
der Bewegung eine zunehmende Datenrate fur die Obertragung von Restfehlern zur Verfugung stent. Im 
Extremfall der Standbildubertragung genugt ein Bit um dem Empfanger mitzuteilen, daB alle Vektoren Nullvek- 
toren sind. Die gesamte Datenrate kann also zur Verbesserung des Bildinhaltes (z. B. Erbohung der Ortauflo- 
sung) herangezogen werden. Dies fuhrt zu einem progressiven Update zu Beginn bewegungsarmer Se- 
quenzphasen. 



Fur die Codierung des Pradiktionsfehlerbildes sind bis jetzt fast ausnahrnslos Verfahren der intraframe 
Codierung von Grauwertbiidern verwendet worden. Diese gehen meist von einer Transformation, zum Beispiel 
DCT, aus. Dabei wird die hohe ortliche Korrelation natiirlicher Grauwertbilder ausgenutzt Durch Transforma- 
tion werden die Daten in ein neues Korrdinatensystem abgebildet, in dem die hier vorliegenden Koeffizienten 
der Transformation nur noch schwache Korrelationen aufweisen. Anders ausgedriickt: Die in einem Bild block 
relativ gleichmaflig verteilte Leistung wird auf wenige Spektralkoeffizienten konzentriert Fur eine Approxima- 
tion des Bildblockes genugt daher die Obertragung einiger weniger leistungstragender Koeffizienten. Die in der 
Literatur veroffentlichten Verfahren unterscheiden sich durch die Auswahl und die Quantisierung der zu 
codierenden Spektralkoeffizienten. 

Eine vollstandige Dekorrelation kann durch eine Karhunen-Loeve Transformation (KLT) erzielt werden. 
Allerdings ist dazu die Berechnung der Kovarianzmatrix des Bildprozesses erforderlich, woraus uber eine 
Eigenwerttransformation die Transformationsmatrix gewonnen wird. Uhter der fur naturliche Bildvorlagen 
metst mit hinreichender Genauigkeit zutreffenden Annahme, daB der bilderzeugende ZufaltsprozeB durch einen 
Markov-ProzeB erster Ordnung rnodelliert werden kann, kann gezeigt werden, daB die DCT die KLT approxi- 
miert [23]. Dies gilt jedoch nur solange, wie der Korrelationskoeffizient in der fur naturliche Bildvorlagen 
typischen GroBenordnung von 0,95— 0,98 liegt. In [24] ist gezeigt worden, daB die DCT fur schwach korrelierte 
Daten weniger gute Eigenschaften aufweist, welches die Eignung der DCT zur Codierung der Pradiktionsfehler- 
bilder in Frage stellt. Aus den vorangegangenen Oberlegungen heraus soil nun zunachst das Pradiktionsfehlersi- 
gnal statistisch analysiert [25] und mit naturlichen Bildvorlagen verglichen werden. AnschlieBend wird der durch 
Anwendung der DCT erreichte Codiergewinn untersucht. Durch Einftihrung einer Strukturcodierung kann eine 
bessere Datenkompression bei gleichzeitig verringertem Rechenaufwand erzielt werden. Der Algorithmus wird 
schlieBlich im Rahmen eines neuen Coderkonzeptes fur eine Rate von 64 kbit/s vorgestellt. 



Verfahren zur Datenkompression von Bildern nutzen die starke Korrelation benachbarter Bildpunkte aus. 
Abb. 4.1.1 zeigt die Autokorrelationsfunktion, ermittelt aus 150 Bildern die Sequenz "MISS AMERIKA" fiir 
jeweils horizontale und vertikale Richtung. Eine kombinierte Darstellung zeigt Abb. 4.1.2. Aus den Abbildungen 
geht hervor, daB zwei benachbarte Punkte einen Korrelationskoeffizienten von 038 haben. 

Im Vergleich zum Originalbild zeigen die Abb. 4.1.3 und 4.1.4 die entsprechenden Autokorrelationsfunktionen 
fiir die Pradiktionsfehlerbilder, ebenfalls ermittelt aus der Sequenz "MISS AMERIKA" unter Verwendung des 
oben vorgestellten Bewegungskompensationsalgorithmus. Deutlich ist die nun wesentlich geringere Korrelation 
der Bildpunkte zu erkennen. Der Korrelationskoeffizient benachbarter Punkte betragt 0,49. 



Das Pradiktionsfehlersignal soli nun ais HochpaBkomponente rnodelliert werden. Eine Schaltung zur Erzeu- 
gung dieser HochpaBkomponente zeigt Abb. 4.15. Fiir die Autokorrelationsfunktion der Differenz zweier 
Signale gilt: 

e(kj)- s(k,l)-g(kj) (4.1.1) 

(p ee (kj)= <p S5 (k,l)+ <p gg (kj)- <f> sg (kj)- <p gs (k t l) (4.1.2) 

<Pss (kj) : Autokorrelation des Originalprozesses, gemessen oder Modellierung durch Markov-ProzeB erster 



<p g g(kj) « <p ss (k,l)* (phh E (k,l)\ Wiener-Lee-Beziehung mit der lmpulsautokorrelationsfunktion des TiefpaBfilters: 
9MT(kJ) (4.1.3) 

(Psg(kJ) - <p ss (kj). h(kj) (4.1.4) 

Vgs (kj) = <p S s (kj) * h(—k, -1) (4.1 .5) 

Unter der Voraussetzung symmetrischer Tiefpasse erhalt man identische Kreuzkorrelationsterme: 



4. Codierung des Pradiktionsfehlerbildes 



4.1 Statistische Eigenschaften des Pradiktionsfehlerbildes 



4.1 .1 Autokorrelationsfunktion eines HochpaBsignals 



Ordnung 
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h(kj) = h(-k, -o = - vgjkj) (4.L6) 

Gleichung (4.1.2) vereinfacht sich entsprechend zu: 
tp^Kl) = <p ss (kj) + wtfWJJ - 2 • [<Pss(k,!)- h(kj) (4.17) 

Wahlt man fur h(kj)zmm idealen TiefpaB 

H(u, v) = rect (u/U) • rect (v/V) o - o — £/V.5j(n 6*; • 5/ (n VI) (4. 1 .8) 
erhalt man: 

<M^^ (4.1.9) 

4.1.2. Autokorrelationsfunktion eines Markov-Prozesses ersterOrdnung 

Zur Berechnung von ^/Jt/Jmodelliert man das Zufallssignal s(mji)2\s autoregressiven ProzeB. Ein AR-Pro- 
zeB oder auch Markov-ProzeO erster Ordnung ist durch einen "weiSen" und zeitdiskreten ZufallsprozeB z(n) und 
die folgende Beziehung gegeben (zur Vereinfachung erfolgt die Ableitung hier I -dimensional, zur Erweiterung 
auf rnehr Dimensionen muB zwischen separierbaren und isotropen Modellen unterschieden werden, siehe[36]): 

x(n) « z (n) + p • x (n - I) mit p = Autokorrelationskoefflzient (4.1.10) 

= z(n) + V (>' n ' z ( " ~J ] 

j \ 

Fureine Verschiebung um kg\\t: 
x(n + it) = z(n + k) + £ P' ' 2 {n + k ~& ( 4 1 M > 

Damit errechnet sich die Autokorrelationsfunktion <p X x(k) eines Markov-Prozesses erster Ordnung: 
<p xr (k) « E[x(n) ■ x(n + k)J 

= ^ (A:) + S P 7 • ff.-r (A + i P* • 9z: <* 'J) + i Si PV ' <* + ' -7) (4.1-12) 

Mit der Autorkorrelationsfunktion des "weiBen" Prozesses 
<Pzz{k)^d l z d(k) (4.1.13) 
erhalt man: 

- <* 2 • W = a, 2 ■ exp(|A| • In (a)) (4.1.14) 

Die Varianz des Markov-Prozesses folgt aus der Varianz des Ausgangsprozesses unter Berilcksichtigung des 
Korrelatoinskoeffizienten zu: 

<Jz 2 



^-^(0)--^- (4-1-15) 



Durch Normierung auf die Varianz erhalt man die normierte Autokorrelationsfunktion: 

p«W-exp(|A|.|nO>) (4.1.16) 

4.13 Autokorrelationsfunktion eines hochpaBgefilterten Markov-Prozesses 

Die ^Correlation benachbarter Bildpunkte entsteht durch die zeitliche Korrelation des zeitkontinuieriichen 
Videosignals. Die Berechnung derAutokorrelationsfunktion eines tief- bzw. hochpaBgefilterten Markovprozes- 
ses erster Ordnung soil zur Vereinfachung fur zeitkontinuierliche Signale durchgefiihrt werden. Die Autokorela- 
tionsfunktion eines zeitkontinuieriichen Markov-Prozesses erster Ordnung ist gegeben durch: 

AtaM-«P(-M/T; (4.1.17) 
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Es ergibt sich folgende Beziehung zwischen der ortlichen Korrelation p und der Zeitkohstante T: 



— X X X X — ► scan-Zeile 

< k = 1 > 



- In (p) = - 1/7 7 - J/ mil dt = Zeit zwischen Abtastwerten (4.1.18) 



7*= — — mit At ~ 150 ns und p = 0,98 

* - In (p) 

7= 7,42 [as 

Aus der Autokorrelationsfunktion Pxjt(t) erhah man das Leistungsdichtespektrum 



tf> ri (J) = c - ,,l/r e-^ ff/ ' df (4.1.19) 



= 2 r 
. l + (2 ^77) 2 

Das Leistungsdichtespektrum wird nun ideal hochpaBgefiltert mit der Grenzfrequenz / 0 : 

^fl-TTitV""** (4120) 

<Z>xx(0=*° furO </</<>. 

Die Autokorrelationsfunktion des hochpaBgefilterten Markovprozesses ergibt sich durch inverse Fourier- 
transformation. Die resultierende Autokorrelationsfunktion ist die Faltung der Autokorrelationsfunktion des 
Markov-Prozesses mit si(n/ 0 f> Unter der Bedingung fi )) VT, welche hier erfiillt ist, ergibt sich die folgende 
Naherung fur die Autokorrelationsfunktion des bandbegrenzten Prozesses (Ableitung der Naherung siehe 
Anhang): 

Pxx HP (r) * cos(2n/ 0 r) + 2n/ 0 r - (Sl2nf 0 r) - n/2) (4.1.21) 

In Abb. 4.1.6 ist der gemessene Verlauf der Autokorrelationsfunktion des Pradiktionsfehlerbildes dargestellt 
Zum Vergleich wurde das Originalbild mit einem FIR-Filter der GroBe 7 * 7 tiefpaBgefiltert und vom gleichen 
Bild subtrahiert. Der Verlauf der Kurven verdeutlicht die Gultigkeit der Modellannahme. Die Autokorrelations- 
funktion des ideal hochpaBgefilterten Markov-Prozesses erster Ordnung nach Gl. 4.1.21 ist in Abb. 4.17 fur 
2 n/ 0 r - k dargestellt Mit k = Pixelabstand und dem oben fur rangenommenen Wert r = 150 ns erhalt man 
eine untere Grenzfrequenz von f 0 » 1 MHz. Der Unterschied zum Verlauf der gemessenen Autokorrelations- 
funktion in Abb. 4.1.6 erklart sich durch Restkorrelation im Pradiktionsfehlerbild durch unzureichende Bewe- 
gungskompensation. Dies konnte durch Gewichtsfaktoren bei der Modellierung des Pradiktionsfehlerbildes 
nach Abb. 4.1.5 berucksichtigt werden: Originalbild und tiefpaBgefiltertes Originalbild werden vor der Diffe- 
renzbildung multiplikativ gewichtet, urn im Differenzbild einen bestimmten Originalbildanteil zu erhalten. 

Da der Gewinn der in der Bildcodierung verwendeten Pradiktions- und Transformationsverfahren auf einer 
hohen Korrelation der Bildpunkte beruht, soil im folgenden gezeigt werden, daB diese Verfahren zur Codierung 
des Pradiktionsfehlersignals wenig geeignet sind. 

4.2 Anwendung derTransformationscodierung auf schwach korrelierte Daten 

Die schwache [Correlation der Bildpunkte des Pradiktionsfehlerbildes laBt erwarten,daB durch Transforma- 
tionscodierung der Daten keine nennenswerte Leistungskonzentration erzielt werden kann [24]. Zur Abschat- 
zung des Codierungsgewinns werden im folgenden verschiedene Kriterien zur Beurteilung der Effizienz von 
Transformationen untersucht. 

4.2.1 Eigenwerte der Kovarianzmatrix 

Ereignisse eines Zufallsprozesses sind genau dann unkorreliert, wenn die Kovarianzmatrix des Zufallsprozes- 
ses Diagonalform hat, also alle Kovarianzen verschwinden. Fur, den Sonderfall eines GauBprozesses sind die 
Ereignisse sogar statistisch unabhangig. Urn zu einer diagonalformigen Kovarianzmatrix zu gelangen. kann man 
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we^RVansformation durchfuhren, in der Literatur wird di 



eine sogenannte Eigenwer^Transformation durchfuhren, in der Literatur wird diese Transformation "Karhunen- 
Loeve" oder auch "Hotelling-Transformation" genannt Dabei bilden die Eigenvektoren die Spalten der Trans- 
formationsmatrix. Diese KLT steltt demnach das erreichbare Optimum fur eine Transformationscodierung dar. 
Man kann zeigen, daB die DCT fur die Klasse der naturlichen Bildvorlagen, welche durch einen autoregressiven 
Prozess erster Ordnung modelliert werden konnen, die KLT mit groBer werdender BlockgroBe asymptotisch 5 
approximiert. Da fur die KLT kein schneller Algorithmus existiert und die Transformationsmatrix relativ 
rechenaufwendig an die jeweilige Statistik angepaBt werden muB, spricht man bei der DCT auch von einer 
schnellen KLT. Durch Sortierung der Eigenvektoren in der Transformationsmatrix, entsprechend dem Betrag 
der zugehorigen Eigenwerte, erreicht man bei der KLT eine Leistungskonzentration auf die Spektralkoeffizien- 
ten mit kleinstem Index. Der Gewinn durch Leistungskonzentration ist dabei umso groBer je groBer der 10 
Unterschied im Betrag der Eigenwerte ist. In Abb. 4.2.1 wird der Verlauf der Eigenwerte fur die Statistik des 
Pradiktionsfehlerbildes und im Vergleich dazu fur die Originalsequenz gezeigt Demur durch Transformations- 
verfahren kein wesentlicher Gewinn zu erzielen ist. 

Fur den Fail der DCT wird in Abb. 4.2.2 der Verlauf der Varianzen der Spektralkoeffizienten verglichen. Fur 
das Pradiktionsfehlersignal erhalt man im Vergleich zu naturlichem Bildmaterial eine relativ geringe Abnahme 15 
der Varianzen mit steigender Koeffizientenordnung. Die akkumuHerten spektralen Varianzen in Abhangigkeit 
von der Anzahl der ubertragenen Spektralkoeffizienten zeigt Abb. 4.2.3. Fur eine naturliche Bildvorlage wird die 
Varianz des Bildblockes schon durch Berucksichtigung weniger Koeffizienten fast vollstandig reprasentiert. Im 
Falle des Pradiktionsfehlersignals sind fiir das Erreichen der gleichen Wechselleistung wesentlich mehr Koeffi- 
zienten erforderlich. 20 



* 4.2.2 Entropie 

Ein weiteres EffizienzmaB fiir die Transformation kann mit der Entropie gewonnen werden. Dazu wird die 
Entropie erster Ordnung sowohl im Bildbereich, als auch im Spektralbereich berechnet. Im SpektraJbereich wird 25 
fiir den Fall, daQ alle Spektralkoeffizienten gleiche Werte annehmen die Entropie maximal. Dies kann als 
vollstandiges Fehlen der Leistungskonzentrationseigenschaften angesehen werden. Andererseits wird die En- 
tropie im Spektralbereich fiir die Konzentration der Leistung auf einen Koeffizienten minimal. Im Bildbereich 
erhalt man fiir die Entropie erster Ordnung 



L 

H(x) = - X Piiog lPk , (4.2.1) 

A - I L 

35 

mit pk als der Wahrscheinlichkeit, daB die Zufallsvariable *den Wert /> annimmt Der Vorrat an Zeichen ergibt 
sich aus der Quantisierung der Bildpunkkte mit 8 bit in diesem Fall zu L = 2 8 . Der Wert von H(x)\st ein MaB fur 
den mittleren Informationsgehalt eines Bildpunktes des Pradiktionsfehlerbildes. An Hand von 50 Pradiktionsfeh- 
lerbiidern aus der Testsequenz "MISS AMERTKA" wurde der Wert fur die Entropie bestimmt: H(x) = 3,82 
bit/pixel. 40 

Zum Vergleich wird nun eine blockweise diskrete Cosinus Transformation mit einer B!ockgr6Be von 8*8 
Bildpunkten auf das Pradiktionsfehlerbild angewendet. Aus den Wahrscheinlichkeiten fiir das Auftreten der 
Amplituden der Spektralkoeffizienten errhittelt man nun die Entropie im Spektralbereich H(u). Geht man von 
einer optischen und fur jeden Spektralkoeffizienten getrennten Codierung aus erhalt man die Entropie durch 
Mittelung der Einzelentropien fiir jeden Koeffizienten: 45 

N * 0 j 0 m I .if 50 

Der Spektralkoeffizient t/'^nimmt mit der Wahrscheinlichkeit ptf 1 ^ einen Wert aus dem mdglichen Wertebe- 
reich vom [(1 — M) < u < A//an. Dabei muB Mhinreichend groB gewahlt werden. Der mogliche Wertebereich 
der Spektralkoeffizienten ist zum Beispiel in [14] angegeben. 

Fur die oben erwahnte Sequenz wurden gemessen : 55 
h(u) = 3,59 bit/pixel; 
H'(u) = 3,45 bit/pixel. 

Diese Ergebnisse widersprechen der allgemeinen Annahme, daB durch Transformationscodierung des Pradik- 
tionsfehlerbildes eine Datenkompression erreicht werden kann. Vielmehr wird die Entropie durch Transforma- 
tion oft vergroBert. Auch die getrennte Codierung jedes einzelnen Spektralkoeffizienten erreicht nur eine 60 
geringe Verbesserung. 



423 Momente hoherer Ordnung 



Von Strobach wurden in [32] ein Verfahren vorgeschlagen, die geraden Momente hoherer Ordnung als 65 
Indikator fiir die Leistungskonzentration zu verwenden. Die Motivation fiir ein derartiges Effizienz-Kriterium 
ergibt sich aus der Leistungsinvarianz der verwendeten Transformationen. Die Momente zweiter Ordnung sind 
also im Original- Spektralbereich identisch. Fur die Transformationsmatrix 7* erhalt man fur den Datenvektor x 



13 



E 38 37 590 Al 



den Vektor der Spektralkoeffizienten y (Zur Vereinfachung der Darstellung wird nur'der eindimensionale Fall 
abgeleitet, die Erweiterung auf zwei Dimensionen folgt direkt): 

y « Tx (4.2.3) 

yy=A J 7 t ^ = jr f x — Leistungsinvarianz (4.2.4) 
oder in Momentendarsteilung 



iy(/> = X^o ( 4 - 2 - 5 > 

t , if 

Dies ist fur die Momente hoherer Ordnung nicht mehr der Fall: 



Z/ (>)4 £ (/) fur A:> 2 und * gerade (4 2 6) 

Man kann erwarten, daB bei vorhandener Leistungskonzentration die Momente hoherer Ordnung im Spek- 
tralbereich wesentlich groBere Werte annehmen als die entsprechenden Momente im Originalbereich. Aus dem 
Verhaltnis der Momente hoherer Ordnung im Original und im Spektralbereich erhalt man also ein MaB fur den 
Grad der erreichten Leistungskonzentration. Dieser Leistungskonzentrationskoeffizient pjt in Abhangigkeit von 
der Ordnung der Momente Arist folgendermaBen definiert: 



p k = p k (jr. T) = — fiir k>2 und k gerade (4.2.7) 

I } 

Abb. 4.2.4 zeigt die Verteilung dieses Kriteriums fiir das Moment vierter Ordnung und die Testsequenz "MISS 
AMERIKA". Fiir den Bereich pk > 1 kann eine Transformation vorteilhaft eingesetzt werdea Die Abbildung 
zeigt jedoch eine Haufung urn den Wert p 4 = 2. Fur natiirliche Bildvorlagen wird typischerweise ein Wert von p 4 
« 63 erreicht. Daraus kann man ersehen, daB die Transformation in vielen Fallen eine Expansion der Daten 
zufolge hat und selbst im Falle der Kornpression nur maBige Leistungskonzentration erreicht wird. 

4.2.4 Rate-Distortion-Funktion 

Eine Abschatzung des erreichbaren Gewinnes durch Transformationscodierung von HochpaBbildern wurde 
von Amor [31] mit Hilfe der Rate-Distortion-Funktion durchgefuhrt. Da, wie oben gezeigt, das vorhegende 
Bildmaterial durch ein HochpaBbildsignal modelliert werden kann, sind die Ergebnisse hier gultig. Danach kann 
mit einer Transformationscodierung eine Einsparung von 0 t 3 bit/Bildpunkt gegenuber PCM-Codierung erzielt 
werden. Dieses Ergebnis stent in Obereinstimmung mit den obigen Effizienzuntersuchungen. 

Auf der Grundlage der oben genannten Ergebnisse wird im folgenden eine Strukturcodierung emgefuhrt, die 
eine effiziente Codierung des Pradiktionsfehlerbildes ermoglicht 

4.3 Strukturcodierung 

Zur Veranschaulichung ist in Abb. 4.3.1 ein typisches Pradiktionsfehlerbild abgebildet. Als Approximation der 
Verteilungsdichtefunktion ist in Abb. 4.3.2 das aus 50 Pradiktionsfehlerbildern gemessene Amptitudenhisto- 
gramm dargestellt. Zur Verwendung der Codierung in einen Bewegtbildcoder mit niedriger Datenrate, wird eine 
Codierung des Pradiktionsfehlerbildes mit « 0,8 bit/Bildpunkt angestrebt. Dieser Wert soli bei subjektiy guter 
Qualitat erreicht werden. Dies ist deshalb besonders wichtig, da die codierten Bildbereiche zur Pradiktion des 
darauffolgenden Frames herangezogen werden. Eine Codierung mit geringer Qualitat wurde verhindern, daB 
das im Empfanger rekonstruierte Bild bei geringer werdender Bewegung das Originalbild sukzessive approxi- 
miert. Daruberhinaus kann die Wahrnehmbarkeit von Rekonstruktionsfehlern durch Bewegungseffekte erhoht 
sein. . . 

Die Helligkeitswerte der Bildpunkte werden unabhangig voneinander und linear in 256 Stufen quantisiert. 
Diese Auflosung ist notig, damit im Bereich hochster Kontrastempfindlichkeit des menschlichen Sehapparates 
keine Quantisierungsfehler wahrnehmbar werden. Diese Kontrastempfindlichkeit hangt aber sehr stark von der 
Ortsfrequenz der beobachteten Struktur ab. Dieser Zusammenhang wurde z. B. in [34] untersucht und ist in 
Abb. 4.3.3 dargestellt. Diese sogenannte Modulationsiibertragungsfunktion zeigt ein deutliches Maximum der 
Empfindlichkeit fur Ortsfrequenzen urn 1 bis 5 Zyklen pro Grad. Der Verlauf der Modulationsubertragungsfunk- 
tion ist stark von der Grundhelligkeit abhangig. In alien Fallen ist jedoch ein starker Riickgang der Empfindlich- 
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keit fur hohere Ortsfrequ^nzen zu beobachten. Daher ist eine hohe Amplitidenauflosung mit 8 bit/Bildpunkt im 
Falle des Pradiktionsfehlersignals. welches ja, wie oben gezeigt, als HochpaBkomponente mit hinreichender 
Genauigkeit modelliert werden kann, nicht erforderlich. 

Die lineare Quantisierung des Originalbildes ist wegen der annahernden Gieichvertetlung der Arnplituden 
gerechtfertigt. Diese Voraussetzung trifft jedoch im Falle des vorliegenden Bildmaterials nicht zu, wie Abb. 43.2 
zeigt. Die Form der Verteiiungsdichtefunktion kann bei linearer Quantisierung durch Entropiecodierung der 
Ersatzwerte ausgenutzt werden. Dadurch wird die Verteilungsredundanz entfernt; allerdings liegen die Einspa- 
rungen weit oberhalb der zu erreichenden Zieldatenrate. 

Fur das Qualitatskriterium "mittlerer quadratischer Fehler" ist von Max [28] ein Algorithmus zur Quantisie- 
rung mit minimalem Fehler angegeben worden. Die Berechnung der Ersatzwerte und Stufen errfolgt jedoch 
iterativ und ist mit betrachtlichem Aufwand verbunden. Die von Amor [31] durchgefiihrten Untersuchungen an 
HochpaBkomponenten naturlicher Bildvorlagen haben zum Ergebnis.daB eine dreiwertige Quantisierung dann 
ausreichend ist, wenn die Quantisiererkennlinien adaptiv in mindestens vier KJassen umgeschaltet werden. Die 
oben gezeigte mdgliche Modellierung des Pradiktionsfehlerbildes durch ein HochpaBbild und die daraufhin 
durchgefiihrten Untersuchungen mit dreiwertiger Quantisierung bestatigen die Obertragbarkeit der Ergebnisse. 
Die Verwendung eines Nullersatzwertes bietet sich wegen der spitzen Form der Verteiiungsdichtefunktion an. 
Die Bestimmung der positiven und negativen Ersatzwerte fur jede der vier Quantisiererkennlinien erfolgt nach 
folgendem Algorithmus (siehe Abb. 4.3.4): 

* Bestimmung von 3 KJassengrenzen an Hand der Fehlervarianz; die Unterteilung wird so vorgenomrnen, 
daB in jede KJasse ungefahr die gleiche Anzahl von Blockrealisationen fallt. 

* Approximation der Verteilungsdichtefunktionen p(x)filr jede KJasse durch Berechnung des Amplituden- 
histogramms getrennt nach {Classen. 

* Berechnung des Quantisierer-Ersatzwertes, der den rnittleren quadratischen QuantisierungsfehLer mini- 
miert. Es wird eine symmetrische Form der Verteiiungsdichtefunktion vorausgesetzt. Die Leistung des 
Fehlers N q berechnet sich aus der Amplitude des Fehlersignals x und bei bekannter Verteiiungsdichtefunk- 
tion/?^ fur dieSchweile u und den Ersatzwert vzu: 



N a = \ln 



(4.3.1) 



Die Bedingung fur minimalen Quantisierungsfehler lautet: 
-^-0 (43.2) 

Darausergibt sich der optimale Ersatzwert V opt zu: 



255 

I] P (X) X 

V = (4 3 3) 



Fur die Berechnung wird zunachst eine Schwelle u » 1 angesetzt 

* Bestimmung der optimalen Schwelle u op t fur den gewahlten Ersatzwert v op u so daB der Quantisierungs- 
fehler minimal wird. Dazu wird ausgehend von der Schwelle u = 1 diese solange vergroBert, bis die 
Leistung des resultierenden Fehlersignals ihr Minimum erreicht 

Die Berechnung der Quantisiererersatzwerte und Schwellen wird fur jedes Bild erneut vorgenomrnen, so daB 
eine optimale Adaption an die Bildstatistik erzielt wird. Fur die Verwendung der Strukturcodierung in einem 
Bewegtbildcoder ist diese Tatsache besonders wichtig: Bei groBen Bildveranderungen kann der Bildaufbau 
durch Verwendung groBer Ersatzwerte rasch erfolgen. Bei abklingender Bewegung werden kleinere Ersatzwer- 
te berechnet, was die asymptotische Annaherung an die Originalbildqualitat garantiert. Die den vier Klassen 
entsprechenden Verteilungsdichtefunktionen sind am Beispiel eines Bildes in Abb. 435 dargestellL In der 
Tabelle sind die Daten zusammengestellt: 
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Varianzendes Fehlerbildes Klasse Grenzen Ersatzwerte 



0(=p2{ 764 

764(=p 2 ( 996 

996{=p2(1737 
1737 (= ^(3155 
3155(« /^(dct-Schwelle 
dct-Schweile< = p 2 



10 



1 

2 
3 
4 



-3,03 
-3,0,3 
-4,0,4 
-7,07 

DCT codierter 
Originalbildblock 



0,0,0 
-5,0,5 
-5,0,5 
-7,0,7 
-1 2,0J 2 



Die Adaption in vier Klassen erfordert es allerdings,diese Overhead-Inforrnationen dem Empfanger mitzutei- 
len. Dies benotigt ca. 40 bit/Bild, kann also vernachlassigt werden. Alternativ konnten die Verteilungsdichtefunk- 

15 tionen durch verallgemeinerte GauBfunktionen modelliert werden. Nach der Anpassung der Formfaktoren kann 
eine einmalige, optimale Bestimmung der Schwellen und Ersatzwerte erfolgen. Dadurch ist zwar keine nennens- 
werte Einsparung an Datenrate zu erzielen, die Struktur des Senders vereinfacht sich jedoch erheblich, was fur 
eine Hardwarerealisierung wichtig ist. Die Auswahl der Quantisierungskennlinie erfolgt jeweils fur einen 8*8 
Punkte groBen Bildblock und muB ebenfalls zusatzlich ubertragen werden. 

20 Zur Obertragung der dreiwertigen Bilder soil nun untersucht werden, ob sich bestimmte, besonders haufig 
vorkomrnende Muster herausbilden. Ein derartiges Verfahren wurde bereits von Shibata[35]zur Codierung von 
Videosignalen vorgeschlagen. Durch eine orthogonale Transformation wurde eine Analyse der vorherrschenden 
Muster durchgefuhrt. Es zeigte sich, daB bei naturlichem Bildmaterial und Verwendung der Hadamard-, bzw. 
Slant-Transformation nur ungefahr 1000 verschiedene Muster bei einem 16 • 16 Bildpunkte groBen Block 

25 auftraten. Die Vorgehensweise kann als ein Sonderfall der Codebuchgenerierung fur eine Vektorquantisierung 
angesehen werden: Aus einem feststehenden Codebuch, gegeben durch die Basisbilder der verwendeten Trans- 
formation, wird ein Untercodebuch der am haufigsten auftretenden Muster selektiert. 

Wegen der dreiwertigen Quantisierung und bei Untergliederung in hinreichend kleine Unterblocke der GroBe 
N x N Bildpunkte, kann wegen der begrenzten Anzahl der vorkommenden Mdglichkeiten zunachst ein voll- 

30 standiges Codebuch erstellt werden. Im Gegensatz zu Verfahren derTransformationscodierung wo der Trans- 
formationsgewinn mit steigender BlockgroBe zunimmt, bieten groBe Blocke wegen der mangelnden Korrelation 
der Bildpunkte hier keine Vorteile. Die Verwendung kleinerer Blocke bietet im Gegenteil den Vorteil, daB 
Blockstrukturen im Bild wegen der reduzierten Empfindlichkeit des menschlichen Sehapparates fur hohere 
Ortsfrequenzen nicht oder nicht so leicht wahrgenotnmen werden. Ordnet man jedem Blocktyp ein Codewort zu, 

35 benotigt man3 A/x// Codeworte. Schon fur N — 3 betragt diese Zahl 19 683, so daB fur JVnur der Wert 2 in Frage 
kommt. Die Auftrittshaufigkeit der nun moglichen 81 verschiedene Blocklypen ist in Abb. 4.3.6 dargestellt. Der 
Index der Typen berechnet sich wie folgt: 



40 



Positioncodc: 





3 


9 


27 



Faktor: negativer Ersatzwert: *1 
Null-Ersatzwert: *0 
positiver Ersatzwert: *2 



45 



Beispiel: 



50 



+ 


0 


0 





crgibt Index = 29 



Selbst unter Ausnutzung der Verteilung der Auftritthaufigkeit durch Entropiecodierung ergibt sich eine Rate 
von 1,4 bit/Bildpunkt. Durch Eingrenzung der Typenvielfalt soil nun die erforderliche Rate vermindert werden, 
ohne groBe subjektive QualitatseinbuBen in K.auf nehmen zu mussen. Die im Abb. 43.6 mit markierten 
55 Blocktypen enthalten zugleich negative und positive Ersatzwerte. Ihre Auftrittshaufigkeit ist relativ gering. 
Oberfuhrt man diese Typen in Typen, welche nur positive und nur negative Ersatzwerte enthalten, kann die Zahl 
der moglichen Typen ohne wesentliche QualitatseinbuBe auf 31 gesenkt werden. Die Oberfuhrung in andere 
Blocktypen geschieht nach den folgenden Regein: 

60 * Blocke, die gleichviele positive und negative Ersatzwerte haben, werden durch Blocke mit Index =0, d. h. 

nur Nullersatzwerte, reprasentiert. 

* Blocke, welche mehr positive als negative Ersatzwerte haben, werden durch positive und Nullersatzwerte 
dargestellt. 

* Wie oben, aber fur eine Oberzahl negativer Ersatzwerte. 

65 

Durch diese MaBnahmen kann die Zieldatenrate von 0,8 bit/Bildpunkt erreicht werden. Abb. 4.3J zeigt die 
Auftritthaufigkeit der yerbleibenden 31 Blocktypen. Unter Verwendung eines Quadrates innerhalb eines Upda- 
te-Blockes der GroBe 8*8 kann die Dominanz der Blocktypen mit ausschlieBlich Nullersatzwerten ausgenutzt 



16 




DE 38 37 590 A 




und eine weitere Reduzierung derDatenrate erreicht werden. 



4.4 Coder-Konzeptfur64kbit/s 



Die oben dargelegten Untersuchungen lassen die Strukturcodierung fur eine Verwendung in einem 64 kbit/s 
Codekonzept geeignet erscheinen. Im folgenden sollen zunachst die Besonderheiten herausgestellt werden, die 
das hier gewahlte Gesamtkonzept neben der Verwendung einer neuen Codierung gegenuber anderen Ansiitzen 
auszeichnen: 

* Es wird nicht das gesamte Fehlerbild zum Empfanger ubertragen. Entsprechend der Wirksamkeit der 
Bewegungskompensation und der zur Verfugung stehenden Restdatenrate werden nur die Bldcke zum 
Empfanger Ubertragen (Update), welche das groQte FehlermaB aufweisen. Zur Signalisierung. Overhead- 
Codierung, wird ein Quadtree verwendet 

* Es wird keine einheitliche Codierung des Pradiktionsfehlersignals vorgenommen. An Hand des blockwei- 
sen Fehlermafies wird die Wirksamkeit der Bewegungskompensation klassifiziert. Dabei ist es in Bereichen, 
wo die Bewegungskompensation versagt, zum Beispiel durch neue Bildteile, die in die Szene kommen, 
effektiver, einen DCT codierten Originalbildblock zum Empfanger zu ubermitteln, als den Bereich durch 
Updates zu codieren. 

* Das Coderkonzept verwendet keinen Puffer zur Erzielung einer konstanten Datenrate. Vielmehr wird fur 
jeden Frame exakt die zur Verfttgung stehende Rate ausgenutzt. Der Vorteil dieser Vorgehensweise ist 
neben der einfachen Struktur ohne Ruckkopplung und Buffersteuerung vor allem die konstante Codierqua- 
litat. Die konstante Codierqualitat der als "Update" ubertragenen Bildteile ist eine wichtige Voraussetzung 
fur die Wirksamkeit der Pradiktion des nachfolgenden Bildes. 

Ausgehend von einem ublichen hybriden Coder/Decoder Konzept (Abb. 4.4.1. a) ist das Coderkonzept gemaB 
der Erfindung in einem detaillierten Blockschaltbild in Abbildung 4.4.1.b dargestellL Einzelne Blocke sollen im 
fotgendeneingehender vorgestellt werden: 



Mit Hilfe der Bewegungsvektoren fur jeden Bildblock wird ein Schatzbild erstellt. Die Bewegungsvektoren 
werden nur aus der Luminanzinformation ermittelt, aber auch zur {Compensation der beiden Chrominanzkom- 
ponenten eingesetzt. Dies ist moglich, da Chrominanzanderungen ohne entsprechende Veranderungen in der 
Luminanz auBerst selten sind. Durch Subtraktion des Originalbildes erhalt man das Differenzbild. Fur jeden 
Bildblock wird das FehlermaB, mittlerer quadratischer Fehler(MQF), berechneL Die Bewegungsyektorinforma- 
tion wird vektorquantisiert. Die starke Dominanz von Null-Vektoren (mehr als 50% typischerweise) verschlech- 
tert die Moglichkeit einer Entropiecodierung der Bewegungsvektoren, da fur den Nullvektor minimal 1 Bit 
ubertragen werden muB. Deshalb wird eine Quadtree-Codierung der Bewegungsvektoren vorgenommen. Nach 
Abzug der fur die Obertragung der Bewegungsvektoren erf order lichen Datenrate erhalt man die Restdatenrate, 
die zur Codierung des Pradiktionsfehlers zur Verfugung steht Die Anzahl der mit dieser Restdatenrate uber- 
tragbaren Updateblocke wird aus dem Codierergebnis des vorhergehenden Bildes geschatzt. 



Mit Hilfe des MQF werden die Bildblocke klassifiziert [33]: 

Typ A: In Bildbereichen in denen keine Bewegung stattgefunden hat, oder die Bewegung in Form starrer 
Translation erfolgte, welche durch die Schatzung praktisch vollstandig kompensiert werden konnte, erhalt 
man ein sehr kleines FehlermaB. Blocke vom Typ A brauchen daher nicht weiter betrachtet zu werden. 
Typ B: Hier erfolgte die Bewegung nicht streng nach dem Modell starrer Translation. So konnte das 
Differenzsignal durch die Bewegungsschatzung weitgehend reduziert werden, es verbleiben jedoch Rest- 
fehler, welche ein Update des Blockes erforderlich machen. Diese Restfehler auBern sich im Fehlerbild vor 
allem durch linienhafte Konturen infolge Verformung der Objekte. Eine geeignete Strukturcodierung fur 
diese Daten wurde oben vorgestellt. 

Typ C: Dadurch, daB sich Bildteile stark veranderten, oder neue Bildteile in die Szene kamen, konnte die 
Bewegungskompensation nicht erfolgreich arbeiten. Beispiele fUr derartige Bildbereiche sind freiwerden- 
der Hintergrund, Offnen/SchlieOen oder Augen/des Mundes, Hande/Arme die durch Gestik den Biidrand 
passieren. In all diesen Fallen besteht der Pradiktionsfehler praktisch aus dem neuen Bildbereich, weist also 
die statistischen Eigenschaften eines natiirlichen Bildes, wie zum Beispiel hohe ortliche Korrelation auf. Fur 
diese Bldcke ist die Strukturcodierung weniger, die DCT jedoch sehr geeignet. Die Blocke lassen sich 
einfach durch eine Schwellenoperation der Fehlervarianz detektieren. Man erhalt bei Videotelefonsequen- 
zen typischerweise 0—8 Blocke vom TypC pro Bild. Nach Abzug der dafur bendtigten Datenmenge 
verbleibt die Restdatenrate fur die Codierung der Blocke vom Typ B. Fur die Chrominanzinformation wird 
nur in Bldcke vom Typ A oder Typ B unterschieden, also keine DCT auf Chrominanzblocke angewendet. 



Aus der fur das vorherige Bild benotigten Datenmenge pro Update-Block wird die maximal mogliche Anzahl 



4.4.1 Bewegungsschatzung, Pradiktion 



4.4.2 Klassifikation der zu codierenden Fehlerblocke 



4.43 Auswahl der mit Strukturcodierung zu ubertragenden Bldcke 
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e Oberschreitune der pro Bild erlaubten Datenratedurc 



von Blocken geschatzt, die ohne Oberschreitung der pro Bild erlaubten Datenratedurch Strukturcodierung 
"upgedated" werden kann. Die Reihenfolge der Kandidaten-Blocke wird durch den Betrag des FehlermaBes 
bestimmt Mit anderen Worten, die Blocke, welche den groBten Fehler aufweisen, werden bis zur Erreichung der 
maximaien Datenrate codiert ubertragen. Damit ist sichergestellt, daB die Bildqualitat jeweils das mogliche 

5 Optimum darsteilt. Bei geringerem Bewegungsanteil finden sofort auch Blocke mit kleinerern FehlermaB Beach- 
tung, so daB die Qualitat wieder ansteigt. Dieser Automatismus befindet sich in Obereinstimmung mit dem 
visuellen System des Menschea Man unterscheidet [26] beim rnenschlichen visuellen System ein sogenanntes 
"transient system" und ein "sustained system". Das Vansiente system" ermoglicht die Erfassung schneller 
Bewegungen auf Kosten der Orts- und Amplitudenaufldsung. Das "sustained system** kann auf Bildteile fokussie- 

10 ren und hochste Detailinformation liefern. Zu beachten ist allerdings, daB bei langsamen Bewegungen, denen das 
Auge durch Ausgleichsbewegungen folgen kann [27], das residente System dominiert. 

Ein weiterer Vorteil der Coderstruktur liegt in der Verwendbarkeit des gleichen Algorithmus zur Ubertra- 
gung von hochaufgelosten Standbildern. Sobald die Bewegungsvektoren Null werden, steht durch die Quadtree 
Codierung die gesamte Datenrate fur Updates zur Verfugung. Dadurch wird schnell die hochstmogliche Auflo- 

15 sungerreicht. 

Entsprechend dem oben vorgestellten Algorithmus und der Anzahl der moglichen Update-Blocke wird eine 
Klasseneinteilung innerhalb der fiir die Ubertragung ausgewahlten Blocke vorti Typ B vorgenornmen. Die 
Klassengrenzen werden dabei so gewahlt.daB ungefahr die gleiche Anzahl von Blocken in jeder der vier Klassen 
fallen. Die Bestimmung der Ersatzwerte erfolgt nach den Regeln der Quantisierung mit minimalem Fehler [28] 
20 durch Berechnung der Verteilungsdichtefunktion und der optimalen Ersatzwerte fiir jedes Bild neu. Dadurch 
wird ein progressiver Bildauf bau mit zunachst groBen und dann immer kleiner werdenden Ersatzwerten erzielt. 

4.4.5 Quadtree-Codierung der Overheadin formation 

25 Die Signalisierung, welche Blocke ubertragen werden erfolgt mit Hilfe eines Quadtrees, der neben der 
Information keine Ubertragung/Ubertragung durch DCT/Obertragung durch Strukturcodierung auch die Klas- 
seninformation fur den letzten Fall beinhaltet. Fur die Overhead-Information wird zur Ausnutzung der Vertei- 
lung ein Huffman-Code verwendet Es ergeben sich folgende Codeworte: 



Ereignis Codewort Darstellung 

in Abb. 4.4.2 
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Ein zweiter Quadtree wird fiir die Chrominanz gebildet Abb. 4.4.2 zeigt die Quadtree-codierte Signalisie- 
rungsinformation. Typischerweise werden fiir Anzeige und Klassifizierung der Blocke, also die sogenannte 
Ortsinformation, ungefahr 300 Bits pro Frame fiir die Luminanz und 250 Bits fiir beide Chrominanzkomponen- 
45 tenbenotigt 

4.4.6 Strukturcodierung 

SchlieBlich wird die eigentliche Strukturcodierung vorgenommen. In Abb. 4.4.3 ist das Ergebnis der Struktur- 
50 codierung gezeigt. Die ausgewahlten Blocke entsprechen der Signalisierungsinformation in Abb. 4.4.2. Die 
Rekonsrruktion eines Frames der Sequenz "MISS AMERIKA" und "ALEXIS" codiert mit 64 kbit/s ist in 
Abb. 4.4.4 dargestellt 



Anhang 

Das Leistungsdichtespektrurn einer ideal hochpaBgefilterten Realisation eines Markov-Prozesses erster Ord- 
nungbetragt: 



60 ^-nw"'^* (A1) 

0 XX (f) = o fur 0 { /( /o Durch Integration Qber den DurchlaBbereich des HochpaBfilters erhalt man die 



65 Autokorrelationsfunktion: 
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(r) = 2 ' T I i + (Lt/) 1 cos (2 " fT) d/ ' A 2) 

/ll 

- 2/r J-T7r^W' <m(2,r/r)d/ (A3> 



Fur den FalI,daB l/T* (((2^ 0 ) 2 kann das Integral naherungsweise geldst werden. Mil der Abschatzung 4.1.18 
ergibt sich: T « 7,42 u,s. Fur fo kann bei Bildtelefonsequenzen von einem Wert von » 1 MHz ausgegangen 
werden.sodaB die Ungleichung mit 18,2 • 10 9 «39,5 • 10 12 in der Tat erfullt ist. 



*, t (r) « 2 • 7" • I „ ' 2 ' cos (2 /r/7) d/ (A.4) 
J (2 /r/) 

Ai 



r / cos( 2/r/ 0 /) * \ 

« — : r— : + Si(2^r)-— ) (A.5) 

rrT \ 2irfoT 2 J 

Der obige Ausdruck ergibt nicht <p«(0) = 1. Diese Nortnierung wird durch Division mit <p S s(0) erreicht: 

P«(t) » cos (2jr/ 0 t) + (2tt/ 0 t) • (Si (2*/ 0 t) - tz/2) (A.6) 

Die Funktion p ss (r) ist in Abb. 4.1.7 dargestellt 
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Patentanspruche 

1. Verfahren zum Reduzieren der Datenrate von digitalen Bilddaten mit folgenden Verfahrensschritten: 

a) Ermitteln von Bewegungsvektoren fur Teilbildbereiche in zeitlich aufeinanderfolgenden Bildern 
einer Bildsequenz, derart, daB beziiglich zweier Bilder jeweiis die Abweichung von der Position des 
unverschobenen Teilbildbereichs zur tatsachlichen Position des Teilbildbereiches in einem zeitlich 
folgenden Bild ermittelt und daraus der jeweilige Bewegungsvektor gebildet wird, 

b) Suchen der Verschiebungen der Teilbildbereiche in einem in Teilsuchgebiete geghederten Suchge- 
biet derart, daB jedes dieser Teilsuchgebiete durch eine Ersatzverschiebungsposition charaktensiert 

c) Auswahlen jenes Teilsuchgebietes und damit der Ersatzverschiebungsposition, bei der die Ahnlich- 
keit der Teilbildbereiche zwischen zwei zeitlich aufeinanderfolgenden Bildern am groflten ist, 

d) Aufbereiten der Ersatzverschiebungsposition zu einem Obertragungssignal oder zu einem Start- 
wert fur eine weitere Suche, 

wobei der Schritt a) den Oberbegriff und die Schritte b) bis d) das Kennzeichen bilden. 

2. Verfahren nach Anspruch l,dadurch gekennzeichnet, daB die Suche nach Ersatzverschiebungspositionen 
in dem zuvor ausgewahlten Teilsuchbereich zur Bestimmung genauerer Ersatzverschiebungspositionen 
fortgesetzt wird, jedoch nun mit erhohter ortlicher Aufldsung als im ersten Suchschritt. 

3. Verfahren nach einem der Anspruche 1 oder 2, dadurch gekennzeichnet, daB aus den fur jeden Teilbildbe- 
reich ermittelten Bewegungsvektoren ein Schatzbild erstellt wird, daB aus dem erstellten Schatzbild und 
dem Originalbild durch Differenzbildung ein Pradiktionsfehlerbild gebildet wird, daB eine Auswahl der zu 
ubertragenden Fehlermenge des Pradiktionsbiides getroffen wird in Abhangigkeit eines Fehlerknteriums, 
z. B. der Leistung des Pradiktionsfehlers, und daB die Signalisierung der ausgewahlten Bildteile uber emen 
"Quadtree" codiert wird. r • - j 

4. Verfahren nach Anspruch 3, dadurch gekennzeichnet, daB das Pradiktionsfehlerbild klassifiziert wird 
entsprechend der Wirksamkeit einer Bewegungskompensation, daB in Abhangigkeit der Klassifizierung 

. eine adaptive Grobquantisierung des Pradiktionsfehlers vorgenommen wird, wobei die Quantisierungspa- 
rameter in Abhangigkeit der Klassifizierung gesteuert werden. 

5. Verfahren nach Anspruch 4, dadurch gekennzeichnet, daB zur Grobquantisierung des Pradiktionsfehlers 
Strukturblocke gebildet werden, die aus Gruppen von quantisierten Bildpunkten einer Nachbarschaft 
bestehen. 

6. Verfahren nach Anspruch 4 oder 5, dadurch gekennzeichnet, daB fur Bildbereiche, m denen eine Bewe- 
gungskompensation versagt, Originalbildinformation in dekorrelierter Form ubertragen wird. 

Hierzu 28 Seite<n) Zeichnungen 
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* Zweidimensionale Entropiecodierung 
Vektor-Entropie 
Gesamtdatenmenge 



3.52 bit/Vektor 
1394 bit/Bild 



* Quadtree-Codierung 

Vektor-Entropie ohne Nullvektoren 
Anteil der Vektoren 4 (0,0) 
Ortsinf ormation, Quadtree 
Code fur Vektoren 
Gesamtdatenmenge 



4.45 bit/Vektor 
49,8 % 

241 bit/Bild 
878 bit/Bild 
1119 bit/Bild 
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